Kerangka Materi
    Pengantar Machine Learning
- 
Jenis-jenis machine learning – terawasi vs tidak terawasi
 - 
Dari pembelajaran statistik ke machine learning
 - 
Alur kerja data mining: pemahaman bisnis, persiapan data, pemodelan, penyebaran
 - 
Memilih algoritma yang tepat untuk tugas
 - 
Overfitting dan tradeoff bias-variansi
 
    Gambaran Umum Python dan Perpustakaan ML
- 
Mengapa menggunakan bahasa pemrograman untuk ML
 - 
Memilih antara R dan Python
 - 
Penjelasan singkat Python dan Jupyter Notebooks
 - 
Perpustakaan Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
 
    Pengujian dan Evaluasi Algoritma ML
- 
Generalisasi, overfitting, dan validasi model
 - 
Strategi evaluasi: holdout, cross-validation, bootstrapping
 - 
Metrik untuk regresi: ME, MSE, RMSE, MAPE
 - 
Metrik untuk klasifikasi: akurasi, matriks kebingungan, kelas tidak seimbang
 - 
Visualisasi kinerja model: kurva profit, kurva ROC, kurva lift
 - 
Seleksi model dan pencarian grid untuk penyesuaian
 
    Persiapan Data
- 
Impor dan penyimpanan data di Python
 - 
Analisis eksplorasi dan statistik ringkasan
 - 
Penanganan nilai yang hilang dan outlier
 - 
Standarisasi, normalisasi, dan transformasi
 - 
Pengkodean data kualitatif dan pengolahan data dengan pandas
 
    Algoritma Klasifikasi
- 
Klasifikasi biner vs multikelas
 - 
Regresi logistik dan fungsi diskriminasi
 - 
Naïve Bayes, k-nearest neighbors
 - 
Pohon keputusan: CART, Random Forests, Bagging, Boosting, XGBoost
 - 
Support Vector Machines dan kernel
 - 
Teknik pembelajaran ensemble
 
    Regresi dan Prediksi Numerik
- 
Kuadrat terkecil dan seleksi variabel
 - 
Metode regularisasi: L1, L2
 - 
Regresi polinomial dan model nonlinier
 - 
Pohon regresi dan splines
 
    Jaringan Saraf
- 
Pengenalan jaringan saraf dan pembelajaran mendalam
 - 
Fungsi aktivasi, lapisan, dan backpropagation
 - 
Multilayer perceptrons (MLP)
 - 
Menggunakan TensorFlow atau PyTorch untuk pemodelan jaringan saraf dasar
 - 
Jaringan saraf untuk klasifikasi dan regresi
 
    Peramalan Penjualan dan Analisis Prediktif
- 
Peramalan berbasis deret waktu vs regresi
 - 
Penanganan data musiman dan tren
 - 
Membangun model peramalan penjualan menggunakan teknik ML
 - 
Evaluasi akurasi peramalan dan ketidakpastian
 - 
Interpretasi bisnis dan komunikasi hasil
 
    Pembelajaran Tidak Terawasi
- 
Teknik klastering: k-means, k-medoids, clustering hierarkis, SOMs
 - 
Reduksi dimensi: PCA, analisis faktor, SVD
 - 
Skala multidimensi
 
    Penambangan Teks
- 
Pra-pemrosesan dan tokenisasi teks
 - 
Bag-of-words, stemming, dan lemmatisasi
 - 
Analisis sentimen dan frekuensi kata
 - 
Visualisasi data teks dengan awan kata
 
    Sistem Rekomendasi
- 
Filtering kolaboratif berbasis pengguna dan item
 - 
Desain dan evaluasi mesin rekomendasi
 
    Penambangan Pola Asosiasi
- 
Itemset frekuensi dan algoritma Apriori
 - 
Analisis keranjang belanja dan rasio lift
 
    Deteksi Outlier
- 
Analisis nilai ekstrem
 - 
Metode berbasis jarak dan kepadatan
 - 
Deteksi outlier dalam data berdimensi tinggi
 
    Studi Kasus Machine Learning
- 
Memahami masalah bisnis
 - 
Persiapan data dan feature engineering
 - 
Seleksi model dan penyesuaian parameter
 - 
Evaluasi dan penyajian temuan
 - 
Penyebaran
 
    Ringkasan dan Langkah Selanjutnya
Persyaratan
- 
Pengetahuan dasar tentang konsep machine learning seperti pembelajaran terawasi dan tidak terawasi
 - 
Keterampilan pemrograman Python (variabel, loop, fungsi)
 - 
Pengalaman dalam penanganan data menggunakan perpustakaan seperti pandas atau NumPy sangat membantu tetapi tidak diperlukan
 - 
Tidak diharapkan pengalaman sebelumnya dengan pemodelan lanjutan atau jaringan saraf
 
    Audience
- 
Data scientists
 - 
Analis bisnis
 - 
Insinyur perangkat lunak dan profesional teknis yang bekerja dengan data
 
Testimoni (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Kursus - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.