Hubungi Kami

Kerangka Materi

Pendahuluan

Bagian ini memberikan pengantar umum mengenai kapan harus menggunakan 'machine learning', apa yang perlu dipertimbangkan, dan apa maksudnya, termasuk pro dan kontra. Tipe data (terstruktur/tidak terstruktur/statis/streaming), validitas/volume data, analitik berbasis data vs berbasis pengguna, model statistik vs model machine learning, tantangan dalam unsupervised learning, bias-variance trade-off, iterasi/evaluasi, pendekatan cross-validation, supervised/unsupervised/reinforcement.

TOPIK UTAMA

1. Memahami naive Bayes

  • Konsep dasar metode Bayesian
  • Probabilitas
  • Probabilitas bersama
  • Probabilitas bersyarat dengan teorema Bayes
  • Algoritma naive Bayes
  • Klasifikasi naive Bayes
  • Estimator Laplace
  • Menggunakan fitur numerik dengan naive Bayes

2. Memahami decision trees

  • Divide and conquer
  • Algoritma decision tree C5.0
  • Pemilihan split terbaik
  • Pemangkasan decision tree

3. Memahami neural networks

  • Dari neuron biologis ke neuron artifisial
  • Function aktivasi
  • Topologi jaringan
  • Jumlah lapisan
  • Arah perjalanan informasi
  • Jumlah node di setiap lapisan
  • Pelatihan neural networks dengan backpropagation
  • Deep Learning

4. Memahami Support Vector Machines

  • Klasifikasi dengan hyperplanes
  • Menemukan margin maksimum
  • Kasus data yang linearly separable
  • Kasus data yang tidak linearly separable
  • Menggunakan kernels untuk ruang non-linear

5. Memahami clustering

  • Clustering sebagai tugas machine learning
  • Algoritma k-means untuk clustering
  • Menggunakan jarak untuk menetapkan dan memperbarui cluster
  • Memilih jumlah cluster yang tepat

6. Mengukur performa untuk klasifikasi

  • Bekerja dengan data prediksi klasifikasi
  • Melihat lebih dekat ke confusion matrices
  • Menggunakan confusion matrices untuk mengukur performa
  • Di luar akurasi – ukuran performa lainnya
  • Statistik kappa
  • Sensitivitas dan spesifisitas
  • Precision dan recall
  • F-measure
  • Visualisasi tradeoff performa
  • Kurva ROC
  • Estimasi masa depan performa
  • Metode holdout
  • Cross-validation
  • Bootstrap sampling

7. Menyetel model standar untuk performa yang lebih baik

  • Menggunakan caret untuk penyetelan parameter otomatis
  • Membuat model yang dituning secara sederhana
  • Menyesuaikan proses penyetelan
  • Meningkatkan performa model dengan meta-learning
  • Memahami ensemble
  • Bagging
  • Boosting
  • Random forests
  • Pelatihan random forests
  • Evaluasi performa random forest

TOPIK KURANG UTAMA

8. Memahami klasifikasi menggunakan nearest neighbors

  • Algoritma kNN
  • Menghitung jarak
  • Memilih k yang sesuai
  • Mempersiapkan data untuk digunakan dengan kNN
  • Mengapa algoritma kNN bersifat lazy?

9. Memahami aturan klasifikasi

  • Separate and conquer
  • Algoritma One Rule
  • Algoritma RIPPER
  • Aturan dari decision trees

10. Memahami regresi

  • Regresi linear sederhana
  • Estimasi kuadrat terkecil biasa
  • Korelasi
  • Regresi linear berganda

11. Memahami regression trees dan model trees

  • Menambahkan regresi ke trees

12. Memahami aturan asosiasi

  • Algoritma Apriori untuk pembelajaran aturan asosiasi
  • Mengukur ketertarikan aturan – support dan confidence
  • Membuat sekumpulan aturan dengan prinsip Apriori

Tambahan

  • Spark/PySpark/MLlib dan Multi-armed bandits

Persyaratan

Pemahaman tentang Python

 21 Jam

Jumlah Peserta


Harga per Peserta

Testimoni (7)

Kursus Mendatang

Kategori Terkait