Course Outline
Machine Learning Pendahuluan
- Jenis-jenis pembelajaran mesin – terawasi vs tidak terawasi
- Dari pembelajaran statistik ke pembelajaran mesin
- Alur kerja penambangan data: pemahaman bisnis, persiapan data, pemodelan, implementasi
- Memilih algoritma yang tepat untuk tugas
- Overfitting dan trade-off bias-variance
Python dan Ringkasan Perpustakaan ML
- Mengapa menggunakan bahasa pemrograman untuk ML
- Memilih antara R dan Python
- Crash course Python dan Jupyter Notebooks
- Perpustakaan Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Pengujian dan Evaluasi Algoritma ML
- Generalisasi, overfitting, dan validasi model
- Stra tegi evaluasi: holdout, cross-validation, bootstrapping
- Metriks untuk regresi: ME, MSE, RMSE, MAPE
- Metriks untuk klasifikasi: akurasi, confusion matrix, kelas yang tidak seimbang
- Visualisasi kinerja model: profit curve, ROC curve, lift curve
- Pemilihan model dan grid search untuk penyetelan
Persiapan Data
- Impor dan penyimpanan data dalam Python
- Analisis eksplorasi dan statistik ringkasan
- Mengatasi nilai yang hilang dan outlier
- Standardisasi, normalisasi, dan transformasi
- Perekodean data kualitatif dan pengolahan data dengan pandas
Algoritma Klasifikasi
- Klasifikasi biner vs multiclass
- Regresi logistik dan fungsi diskriminan
- Naïve Bayes, k-nearest neighbors
- Pohon keputusan: CART, Random Forests, Bagging, Boosting, XGBoost
- Mesin vektor dukungan dan kernel
- Teknik pembelajaran ensemble
Regresi dan Prediksi Numerik
- Kuadrat terkecil dan pemilihan variabel
- Metode regularisasi: L1, L2
- Regresi polinomial dan model nonlinier
- Pohon regresi dan spline
Neural Networks
- Pendahuluan ke jaringan saraf dan deep learning
- Fungsi aktivasi, lapisan, dan backpropagation
- Multilayer perceptrons (MLP)
- Memodelkan jaringan saraf dasar menggunakan TensorFlow atau PyTorch
- Jaringan saraf untuk klasifikasi dan regresi
Penjualan Forecasting dan Predictive Analytics
- Peramalan berbasis seri waktu vs regresi
- Mengatasi data musiman dan berdasarkan tren
- Membangun model peramalan penjualan menggunakan teknik ML
- Evaluasi akurasi dan ketidakpastian ramalan
- Interpretasi dan komunikasi hasil Business
Unsupervised Learning
- Teknik klastering: k-means, k-medoids, klastering hierarkis, SOMs
- Pengurangan dimensi: PCA, analisis faktor, SVD
- Multidimensional scaling
Penambangan Teks
- Pra-pemrosesan teks dan tokenisasi
- Bag-of-words, stemming, dan lemmatization
- Analisis sentimen dan frekuensi kata
- Visualisasi data teks dengan word clouds
Sistem Rekomendasi
- User-based dan item-based collaborative filtering
- Mendesain dan mengevaluasi mesin rekomendasi
Penambangan Pola Asosiasi
- Itemset sering muncul dan algoritma Apriori
- Analisis keranjang belanja dan lift ratio
Deteksi Outlier
- Analisis nilai ekstrem
- Metode berbasis jarak dan kepadatan
- Pendeteksian outlier pada data berdimensi tinggi
Machine Learning Studi Kasus
- Memahami masalah bisnis
- Pra-pemrosesan data dan feature engineering
- Pemilihan model dan penyetelan parameter
- Evaluasi dan presentasi temuan
- Implementasi
Ringkasan dan Langkah Selanjutnya
Requirements
- Pemahaman dasar tentang konsep pembelajaran mesin seperti pembelajaran terawasi dan tidak terawasi
- Ketahui tentang pemrograman Python (variabel, loop, fungsi)
- Beberapa pengalaman dalam penanganan data menggunakan perpustakaan seperti pandas atau NumPy akan membantu tetapi bukan merupakan keharusan
- Tidak diharapkan memiliki pengalaman sebelumnya dengan pemodelan lanjutan atau jaringan saraf
Audience
- Ilmuwan data
- Business analis
- Insinyur perangkat lunak dan profesional teknis yang bekerja dengan data
Testimonials (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Course - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.