Course Outline

Pendahuluan

Sesi ini memberikan gambaran umum tentang kapan harus menggunakan 'machine learning', apa yang perlu dipertimbangkan, dan apa artinya semuanya termasuk kelebihan dan kekurangannya. Tipe data (terstruktur/tidak terstruktur/statik/streaming), validitas/volume data, analitik berbasis data vs berbasis pengguna, model statistik vs. model machine learning/ tantangan pembelajaran tidak terawasi, trade-off bias-variance, iterasi/evaluasi, pendekatan cross-validation, supervised/unsupervised/reinforcement.

TOPIK UTAMA

1. Memahami naive Bayes

  • Konsep dasar metode Bayesian
  • Probabilitas
  • Probabilitas bersama
  • Probabilitas bersyarat dengan teorema Bayes
  • Algoritma naive Bayes
  • Klasifikasi naive Bayes
  • Penggunaan estimator Laplace
  • Menggunakan fitur numerik dengan naive Bayes

2. Memahami pohon keputusan

  • Bagi dan kuasai
  • Algoritma pohon keputusan C5.0
  • Mengambil keputusan pemisahan terbaik
  • Pemangkasan pohon keputusan

3. Memahami jaringan saraf

  • Dari neuron biologis ke buatan
  • Fungsi aktivasi
  • Topologi jaringan
  • Jumlah lapisan
  • Arah perjalanan informasi
  • Jumlah node dalam setiap lapisan
  • Melatih jaringan saraf dengan backpropagation
  • Deep Learning

4. Memahami Support Vector Machines

  • Klasifikasi dengan hiperplane
  • Mencari margin maksimum
  • Kasus data yang dapat dipisahkan secara linear
  • Kasus data yang tidak dapat dipisahkan secara linear
  • Penggunaan kernel untuk ruang non-linear

5. Memahami klastering

  • Klastering sebagai tugas machine learning
  • Algoritma k-means untuk klastering
  • Menggunakan jarak untuk menetapkan dan memperbarui klaster
  • Memilih jumlah klaster yang tepat

6. Mengukur kinerja untuk klasifikasi

  • Bekerja dengan data prediksi klasifikasi
  • Penggunaan matriks kebingungan secara lebih mendalam
  • Menggunakan matriks kebingungan untuk mengukur kinerja
  • Di luar akurasi – ukuran kinerja lainnya
  • Statistik kappa
  • Sensitivitas dan spesifisitas
  • Precision dan recall
  • Mengukur F-measure
  • Visualisasi tradeoffs kinerja
  • Kurve ROC
  • Memprediksi kinerja di masa depan
  • Metode holdout
  • Cross-validation
  • Bootstrap sampling

7. Menyesuaikan model standar untuk kinerja yang lebih baik

  • Menggunakan caret untuk penyetelan parameter otomatis
  • Membuat model yang disesuaikan sederhana
  • Menyesuaikan proses penyetelan
  • Memperbaiki kinerja model dengan meta-learning
  • Memahami ensemble
  • Bagging
  • Boosting
  • Hutan acak
  • Melatih hutan acak
  • Evaluasi kinerja hutan acak

TOPIK TERTENTU

8. Memahami klasifikasi menggunakan tetangga terdekat

  • Algoritma kNN
  • Menghitung jarak
  • Memilih nilai k yang tepat
  • Persiapan data untuk penggunaan dengan kNN
  • Mengapa algoritma kNN disebut malas?

9. Memahami aturan klasifikasi

  • Bagi dan kuasai
  • Algoritma One Rule
  • Algoritma RIPPER
  • Aturan dari pohon keputusan

10. Memahami regresi

  • Regresi linier sederhana
  • Pengestimasian kuadrat terkecil biasa
  • Korelasi
  • Regresi linier berganda

11. Memahami pohon regresi dan model tree

  • Menambahkan regresi ke dalam pohon

12. Memahami aturan asosiasi

  • Algoritma Apriori untuk pembelajaran aturan asosiasi
  • Mengukur minat aturan – dukungan dan keyakinan
  • Membangun set aturan dengan prinsip Apriori

Eksklusif

  • Spark/PySpark/MLlib dan Multi-armed bandits

Requirements

Python Pengetahuan

 21 Hours

Number of participants


Price per participant

Testimonials (7)

Upcoming Courses (Minimal 5 peserta)

Related Categories