Course Outline

Machine Learning Pendahuluan

  • Jenis-jenis pembelajaran mesin – terawasi vs tidak terawasi
  • Dari pembelajaran statistik ke pembelajaran mesin
  • Alur kerja penambangan data: pemahaman bisnis, persiapan data, pemodelan, implementasi
  • Memilih algoritma yang tepat untuk tugas
  • Overfitting dan trade-off bias-variance

Python dan Ringkasan Perpustakaan ML

  • Mengapa menggunakan bahasa pemrograman untuk ML
  • Memilih antara R dan Python
  • Crash course Python dan Jupyter Notebooks
  • Perpustakaan Python: pandas, NumPy, scikit-learn, matplotlib, seaborn

Pengujian dan Evaluasi Algoritma ML

  • Generalisasi, overfitting, dan validasi model
  • Stra tegi evaluasi: holdout, cross-validation, bootstrapping
  • Metriks untuk regresi: ME, MSE, RMSE, MAPE
  • Metriks untuk klasifikasi: akurasi, confusion matrix, kelas yang tidak seimbang
  • Visualisasi kinerja model: profit curve, ROC curve, lift curve
  • Pemilihan model dan grid search untuk penyetelan

Persiapan Data

  • Impor dan penyimpanan data dalam Python
  • Analisis eksplorasi dan statistik ringkasan
  • Mengatasi nilai yang hilang dan outlier
  • Standardisasi, normalisasi, dan transformasi
  • Perekodean data kualitatif dan pengolahan data dengan pandas

Algoritma Klasifikasi

  • Klasifikasi biner vs multiclass
  • Regresi logistik dan fungsi diskriminan
  • Naïve Bayes, k-nearest neighbors
  • Pohon keputusan: CART, Random Forests, Bagging, Boosting, XGBoost
  • Mesin vektor dukungan dan kernel
  • Teknik pembelajaran ensemble

Regresi dan Prediksi Numerik

  • Kuadrat terkecil dan pemilihan variabel
  • Metode regularisasi: L1, L2
  • Regresi polinomial dan model nonlinier
  • Pohon regresi dan spline

Neural Networks

  • Pendahuluan ke jaringan saraf dan deep learning
  • Fungsi aktivasi, lapisan, dan backpropagation
  • Multilayer perceptrons (MLP)
  • Memodelkan jaringan saraf dasar menggunakan TensorFlow atau PyTorch
  • Jaringan saraf untuk klasifikasi dan regresi

Penjualan Forecasting dan Predictive Analytics

  • Peramalan berbasis seri waktu vs regresi
  • Mengatasi data musiman dan berdasarkan tren
  • Membangun model peramalan penjualan menggunakan teknik ML
  • Evaluasi akurasi dan ketidakpastian ramalan
  • Interpretasi dan komunikasi hasil Business

Unsupervised Learning

  • Teknik klastering: k-means, k-medoids, klastering hierarkis, SOMs
  • Pengurangan dimensi: PCA, analisis faktor, SVD
  • Multidimensional scaling

Penambangan Teks

  • Pra-pemrosesan teks dan tokenisasi
  • Bag-of-words, stemming, dan lemmatization
  • Analisis sentimen dan frekuensi kata
  • Visualisasi data teks dengan word clouds

Sistem Rekomendasi

  • User-based dan item-based collaborative filtering
  • Mendesain dan mengevaluasi mesin rekomendasi

Penambangan Pola Asosiasi

  • Itemset sering muncul dan algoritma Apriori
  • Analisis keranjang belanja dan lift ratio

Deteksi Outlier

  • Analisis nilai ekstrem
  • Metode berbasis jarak dan kepadatan
  • Pendeteksian outlier pada data berdimensi tinggi

Machine Learning Studi Kasus

  • Memahami masalah bisnis
  • Pra-pemrosesan data dan feature engineering
  • Pemilihan model dan penyetelan parameter
  • Evaluasi dan presentasi temuan
  • Implementasi

Ringkasan dan Langkah Selanjutnya

Requirements

  • Pemahaman dasar tentang konsep pembelajaran mesin seperti pembelajaran terawasi dan tidak terawasi
  • Ketahui tentang pemrograman Python (variabel, loop, fungsi)
  • Beberapa pengalaman dalam penanganan data menggunakan perpustakaan seperti pandas atau NumPy akan membantu tetapi bukan merupakan keharusan
  • Tidak diharapkan memiliki pengalaman sebelumnya dengan pemodelan lanjutan atau jaringan saraf

Audience

  • Ilmuwan data
  • Business analis
  • Insinyur perangkat lunak dan profesional teknis yang bekerja dengan data
 28 Hours

Number of participants


Price per participant

Testimonials (2)

Upcoming Courses (Minimal 5 peserta)

Related Categories