Hubungi Kami

Kerangka Materi

Pendahuluan

Sesi ini memberikan gambaran umum tentang kapan harus menggunakan 'machine learning', apa yang perlu dipertimbangkan, dan apa artinya semuanya termasuk kelebihan dan kekurangannya. Tipe data (terstruktur/tidak terstruktur/statik/streaming), validitas/volume data, analitik berbasis data vs berbasis pengguna, model statistik vs. model machine learning/ tantangan pembelajaran tidak terawasi, trade-off bias-variance, iterasi/evaluasi, pendekatan cross-validation, supervised/unsupervised/reinforcement.

TOPIK UTAMA

1. Memahami naive Bayes

  • Konsep dasar metode Bayesian
  • Probabilitas
  • Probabilitas bersama
  • Probabilitas bersyarat dengan teorema Bayes
  • Algoritma naive Bayes
  • Klasifikasi naive Bayes
  • Penggunaan estimator Laplace
  • Menggunakan fitur numerik dengan naive Bayes

2. Memahami pohon keputusan

  • Bagi dan kuasai
  • Algoritma pohon keputusan C5.0
  • Mengambil keputusan pemisahan terbaik
  • Pemangkasan pohon keputusan

3. Memahami jaringan saraf

  • Dari neuron biologis ke buatan
  • Fungsi aktivasi
  • Topologi jaringan
  • Jumlah lapisan
  • Arah perjalanan informasi
  • Jumlah node dalam setiap lapisan
  • Melatih jaringan saraf dengan backpropagation
  • Deep Learning

4. Memahami Support Vector Machines

  • Klasifikasi dengan hiperplane
  • Mencari margin maksimum
  • Kasus data yang dapat dipisahkan secara linear
  • Kasus data yang tidak dapat dipisahkan secara linear
  • Penggunaan kernel untuk ruang non-linear

5. Memahami klastering

  • Klastering sebagai tugas machine learning
  • Algoritma k-means untuk klastering
  • Menggunakan jarak untuk menetapkan dan memperbarui klaster
  • Memilih jumlah klaster yang tepat

6. Mengukur kinerja untuk klasifikasi

  • Bekerja dengan data prediksi klasifikasi
  • Penggunaan matriks kebingungan secara lebih mendalam
  • Menggunakan matriks kebingungan untuk mengukur kinerja
  • Di luar akurasi – ukuran kinerja lainnya
  • Statistik kappa
  • Sensitivitas dan spesifisitas
  • Precision dan recall
  • Mengukur F-measure
  • Visualisasi tradeoffs kinerja
  • Kurve ROC
  • Memprediksi kinerja di masa depan
  • Metode holdout
  • Cross-validation
  • Bootstrap sampling

7. Menyesuaikan model standar untuk kinerja yang lebih baik

  • Menggunakan caret untuk penyetelan parameter otomatis
  • Membuat model yang disesuaikan sederhana
  • Menyesuaikan proses penyetelan
  • Memperbaiki kinerja model dengan meta-learning
  • Memahami ensemble
  • Bagging
  • Boosting
  • Hutan acak
  • Melatih hutan acak
  • Evaluasi kinerja hutan acak

TOPIK TERTENTU

8. Memahami klasifikasi menggunakan tetangga terdekat

  • Algoritma kNN
  • Menghitung jarak
  • Memilih nilai k yang tepat
  • Persiapan data untuk penggunaan dengan kNN
  • Mengapa algoritma kNN disebut malas?

9. Memahami aturan klasifikasi

  • Bagi dan kuasai
  • Algoritma One Rule
  • Algoritma RIPPER
  • Aturan dari pohon keputusan

10. Memahami regresi

  • Regresi linier sederhana
  • Pengestimasian kuadrat terkecil biasa
  • Korelasi
  • Regresi linier berganda

11. Memahami pohon regresi dan model tree

  • Menambahkan regresi ke dalam pohon

12. Memahami aturan asosiasi

  • Algoritma Apriori untuk pembelajaran aturan asosiasi
  • Mengukur minat aturan – dukungan dan keyakinan
  • Membangun set aturan dengan prinsip Apriori

Eksklusif

  • Spark/PySpark/MLlib dan Multi-armed bandits

Persyaratan

Python Pengetahuan

 21 Jam

Jumlah Peserta


Harga per Peserta

Testimoni (7)

Kursus Mendatang

Kategori Terkait