Kerangka Materi

Ikatan Cepat

  • Sumber Data
  • Pengelolaan Data
  • Sistem rekomendasi
  • Pemasaran yang bertarget

Jenis Data

  • Terbentuk vs tidak terbentuk
  • Statis vs mengalir
  • Data sikap, perilaku dan demografi
  • Analisis terdidik data vs terdidik pengguna
  • Kebenaran data
  • Volume, kecepatan dan variasi data

Model

  • Membangun model
  • Model statistik
  • Belajar mesin

Klasterisasi Data

  • Pengelompokan
  • kGroups, k-means, tetangga terdekat
  • Semut, burung berburung

Model Prediktif

  • Pohon keputusan
  • Mesin vektor dukungan
  • Klasterisasi Naive Bayes
  • Jaringan sarna
  • Model Markov
  • Regresi
  • Metode kelompok

ROI

  • Rasio manfaat/biaya
  • Biaya perangkat lunak
  • Biaya pengembangan
  • Manfaat potensial

Membangun Model

  • Persiapan Data (MapReduce)
  • Membersihkan data
  • Memilih metode
  • Mengembangkan model
  • Menguji model
  • Penilaian model
  • Penempatan dan integrasi model

Tinjauan Perbandingan Software Terbuka dan Komersial

  • Pemilihan paket R-project
  • Pustaka Python
  • Hadoop dan Mahout
  • Proyek Apache terpilih terkait Big Data dan Analitik
  • Solusi komersial terpilih
  • Integrasi dengan perangkat lunak dan sumber data yang ada

Persyaratan

Memahami metode pengelolaan dan analisis data tradisional seperti SQL, data warehouse, business intelligence, OLAP, dll... Memahami statistik dasar dan probabilitas (rata-rata, varians, probabilitas, probabilitas kondisional, dll...)

 21 Jam

Jumlah Peserta


Biaya per Peserta

Testimoni (2)

Kursus Mendatang

Kategori Terkait