Course Outline
Machine Learning Pendahuluan
- Jenis-jenis pembelajaran mesin – terawasi vs tidak terawasi
- Dari pembelajaran statistik ke pembelajaran mesin
- Alur kerja penambangan data: pemahaman bisnis, persiapan data, pemodelan, implementasi
- Memilih algoritma yang tepat untuk tugas
- Overfitting dan tradeoff bias-variance
Python dan Ringkasan Perpustakaan ML
- Mengapa menggunakan bahasa pemrograman untuk ML
- Memilih antara R dan Python
- Pendahuluan cepat tentang Python dan Jupyter Notebooks
- Perpustakaan Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Pengujian dan Evaluasi Algoritma ML
- Generalisasi, overfitting, dan validasi model
- Stra tegi evaluasi: holdout, cross-validation, bootstrapping
- Metriks untuk regresi: ME, MSE, RMSE, MAPE
- Metriks untuk klasifikasi: akurasi, confusion matrix, kelas yang tidak seimbang
- Visualisasi kinerja model: profit curve, ROC curve, lift curve
- Pemilihan model dan grid search untuk penyetelan
Persiapan Data
- Impor dan penyimpanan data dalam Python
- Analisis eksplorasi dan statistik ringkasan
- Mengatasi nilai yang hilang dan outlier
- Standardisasi, normalisasi, dan transformasi
- Perekodean data kualitatif dan penanganan data dengan pandas
Algoritma Klasifikasi
- Klasifikasi biner vs multiclass
- Regresi logistik dan fungsi diskriminan
- Naïve Bayes, k-nearest neighbors
- Pohon keputusan: CART, Random Forests, Bagging, Boosting, XGBoost
- Mesin vektor dukungan dan kernel
- Teknik pembelajaran ensemble
Regresi dan Prediksi Numerik
- Kuadrat terkecil dan pemilihan variabel
- Metode regularisasi: L1, L2
- Regresi polinomial dan model nonlinier
- Pohon regresi dan splines
Unsupervised Learning
- Teknik klastering: k-means, k-medoids, klustering hierarkis, SOMs
- Penurunan dimensi: PCA, analisis faktor, SVD
- Multidimensional scaling
Penambangan Teks
- Pra-pemrosesan teks dan tokenisasi
- Bag-of-words, stemming, dan lemmatization
- Analisis sentimen dan frekuensi kata
- Visualisasi data teks dengan word clouds
Sistem Rekomendasi
- User-based dan item-based collaborative filtering
- Mengembangkan dan mengevaluasi mesin rekomendasi
Penambangan Pola Asosiasi
- Itemset sering muncul dan algoritma Apriori
- Analisis keranjang belanja dan lift ratio
Deteksi Outlier
- Analisis nilai ekstrem
- Metode berbasis jarak dan kepadatan
- Deteksi outlier dalam data berdimensi tinggi
Machine Learning Studi Kasus
- Pemahaman masalah bisnis
- Pra-pemrosesan data dan feature engineering
- Pemilihan model dan penyetelan parameter
- Evaluasi dan presentasi temuan
- Implementasi
Simpulan dan Langkah Selanjutnya
Requirements
- Pemahaman dasar tentang statistik dan aljabar linear
- Ketahui konsep analisis data atau inteligensi bisnis
- Terdapat paparan terhadap pemrograman (disarankan Python atau R) adalah direkomendasikan
- Minat dalam belajar machine learning terapan untuk proyek berbasis data
Audience
- Analisis data dan ilmuwan data
- Statistisi dan profesional riset
- Pengembang dan profesional IT yang menjelajahi alat machine learning
- Siapa saja yang terlibat dalam proyek sains data atau analitik prediktif
Testimonials (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Course - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Course - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback