Course Outline

Machine Learning Pendahuluan

  • Jenis-jenis pembelajaran mesin – terawasi vs tidak terawasi
  • Dari pembelajaran statistik ke pembelajaran mesin
  • Alur kerja penambangan data: pemahaman bisnis, persiapan data, pemodelan, implementasi
  • Memilih algoritma yang tepat untuk tugas
  • Overfitting dan tradeoff bias-variance

Python dan Ringkasan Perpustakaan ML

  • Mengapa menggunakan bahasa pemrograman untuk ML
  • Memilih antara R dan Python
  • Pendahuluan cepat tentang Python dan Jupyter Notebooks
  • Perpustakaan Python: pandas, NumPy, scikit-learn, matplotlib, seaborn

Pengujian dan Evaluasi Algoritma ML

  • Generalisasi, overfitting, dan validasi model
  • Stra tegi evaluasi: holdout, cross-validation, bootstrapping
  • Metriks untuk regresi: ME, MSE, RMSE, MAPE
  • Metriks untuk klasifikasi: akurasi, confusion matrix, kelas yang tidak seimbang
  • Visualisasi kinerja model: profit curve, ROC curve, lift curve
  • Pemilihan model dan grid search untuk penyetelan

Persiapan Data

  • Impor dan penyimpanan data dalam Python
  • Analisis eksplorasi dan statistik ringkasan
  • Mengatasi nilai yang hilang dan outlier
  • Standardisasi, normalisasi, dan transformasi
  • Perekodean data kualitatif dan penanganan data dengan pandas

Algoritma Klasifikasi

  • Klasifikasi biner vs multiclass
  • Regresi logistik dan fungsi diskriminan
  • Naïve Bayes, k-nearest neighbors
  • Pohon keputusan: CART, Random Forests, Bagging, Boosting, XGBoost
  • Mesin vektor dukungan dan kernel
  • Teknik pembelajaran ensemble

Regresi dan Prediksi Numerik

  • Kuadrat terkecil dan pemilihan variabel
  • Metode regularisasi: L1, L2
  • Regresi polinomial dan model nonlinier
  • Pohon regresi dan splines

Unsupervised Learning

  • Teknik klastering: k-means, k-medoids, klustering hierarkis, SOMs
  • Penurunan dimensi: PCA, analisis faktor, SVD
  • Multidimensional scaling

Penambangan Teks

  • Pra-pemrosesan teks dan tokenisasi
  • Bag-of-words, stemming, dan lemmatization
  • Analisis sentimen dan frekuensi kata
  • Visualisasi data teks dengan word clouds

Sistem Rekomendasi

  • User-based dan item-based collaborative filtering
  • Mengembangkan dan mengevaluasi mesin rekomendasi

Penambangan Pola Asosiasi

  • Itemset sering muncul dan algoritma Apriori
  • Analisis keranjang belanja dan lift ratio

Deteksi Outlier

  • Analisis nilai ekstrem
  • Metode berbasis jarak dan kepadatan
  • Deteksi outlier dalam data berdimensi tinggi

Machine Learning Studi Kasus

  • Pemahaman masalah bisnis
  • Pra-pemrosesan data dan feature engineering
  • Pemilihan model dan penyetelan parameter
  • Evaluasi dan presentasi temuan
  • Implementasi

Simpulan dan Langkah Selanjutnya

Requirements

  • Pemahaman dasar tentang statistik dan aljabar linear
  • Ketahui konsep analisis data atau inteligensi bisnis
  • Terdapat paparan terhadap pemrograman (disarankan Python atau R) adalah direkomendasikan
  • Minat dalam belajar machine learning terapan untuk proyek berbasis data

Audience

  • Analisis data dan ilmuwan data
  • Statistisi dan profesional riset
  • Pengembang dan profesional IT yang menjelajahi alat machine learning
  • Siapa saja yang terlibat dalam proyek sains data atau analitik prediktif
 21 Hours

Number of participants


Price per participant

Testimonials (3)

Upcoming Courses (Minimal 5 peserta)

Related Categories