Kerangka Materi
Machine Learning Pendahuluan
- Jenis-jenis pembelajaran mesin – terawasi vs tidak terawasi
- Dari pembelajaran statistik ke pembelajaran mesin
- Alur kerja penambangan data: pemahaman bisnis, persiapan data, pemodelan, implementasi
- Memilih algoritma yang tepat untuk tugas
- Overfitting dan tradeoff bias-variance
Python dan Ringkasan Perpustakaan ML
- Mengapa menggunakan bahasa pemrograman untuk ML
- Memilih antara R dan Python
- Pendahuluan cepat tentang Python dan Jupyter Notebooks
- Perpustakaan Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Pengujian dan Evaluasi Algoritma ML
- Generalisasi, overfitting, dan validasi model
- Stra tegi evaluasi: holdout, cross-validation, bootstrapping
- Metriks untuk regresi: ME, MSE, RMSE, MAPE
- Metriks untuk klasifikasi: akurasi, confusion matrix, kelas yang tidak seimbang
- Visualisasi kinerja model: profit curve, ROC curve, lift curve
- Pemilihan model dan grid search untuk penyetelan
Persiapan Data
- Impor dan penyimpanan data dalam Python
- Analisis eksplorasi dan statistik ringkasan
- Mengatasi nilai yang hilang dan outlier
- Standardisasi, normalisasi, dan transformasi
- Perekodean data kualitatif dan penanganan data dengan pandas
Algoritma Klasifikasi
- Klasifikasi biner vs multiclass
- Regresi logistik dan fungsi diskriminan
- Naïve Bayes, k-nearest neighbors
- Pohon keputusan: CART, Random Forests, Bagging, Boosting, XGBoost
- Mesin vektor dukungan dan kernel
- Teknik pembelajaran ensemble
Regresi dan Prediksi Numerik
- Kuadrat terkecil dan pemilihan variabel
- Metode regularisasi: L1, L2
- Regresi polinomial dan model nonlinier
- Pohon regresi dan splines
Unsupervised Learning
- Teknik klastering: k-means, k-medoids, klustering hierarkis, SOMs
- Penurunan dimensi: PCA, analisis faktor, SVD
- Multidimensional scaling
Penambangan Teks
- Pra-pemrosesan teks dan tokenisasi
- Bag-of-words, stemming, dan lemmatization
- Analisis sentimen dan frekuensi kata
- Visualisasi data teks dengan word clouds
Sistem Rekomendasi
- User-based dan item-based collaborative filtering
- Mengembangkan dan mengevaluasi mesin rekomendasi
Penambangan Pola Asosiasi
- Itemset sering muncul dan algoritma Apriori
- Analisis keranjang belanja dan lift ratio
Deteksi Outlier
- Analisis nilai ekstrem
- Metode berbasis jarak dan kepadatan
- Deteksi outlier dalam data berdimensi tinggi
Machine Learning Studi Kasus
- Pemahaman masalah bisnis
- Pra-pemrosesan data dan feature engineering
- Pemilihan model dan penyetelan parameter
- Evaluasi dan presentasi temuan
- Implementasi
Simpulan dan Langkah Selanjutnya
Persyaratan
- Pemahaman dasar tentang statistik dan aljabar linear
- Ketahui konsep analisis data atau inteligensi bisnis
- Terdapat paparan terhadap pemrograman (disarankan Python atau R) adalah direkomendasikan
- Minat dalam belajar machine learning terapan untuk proyek berbasis data
Audience
- Analisis data dan ilmuwan data
- Statistisi dan profesional riset
- Pengembang dan profesional IT yang menjelajahi alat machine learning
- Siapa saja yang terlibat dalam proyek sains data atau analitik prediktif
Testimoni (3)
Meskipun harus melewatkan satu hari karena pertemuan dengan klien, saya merasa telah memiliki pemahaman yang jauh lebih jelas tentang proses dan teknik yang digunakan dalam Machine Learning serta kapan saya akan menggunakan pendekatan tertentu daripada yang lain. Tantangan kami sekarang adalah berlatih apa yang telah kita pelajari dan mulai menerapkannya ke domain masalah kita.
Richard Blewett - Rock Solid Knowledge Ltd
Kursus - Machine Learning – Data science
Diterjemahkan Mesin
Saya suka bahwa pelatihan fokus pada contoh dan pemrograman. Saya berpikir bahwa tidak mungkin untuk memuat begitu banyak konten dalam tiga hari pelatihan, tetapi saya salah. Pelatihan mencakup banyak topik dan segalanya dilakukan dengan sangat rinci (terutama penyetelan parameter model - saya tidak menyangka akan ada waktu untuk ini dan saya sangat terkejut).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Kursus - Machine Learning – Data science
Diterjemahkan Mesin
Ini menampilkan banyak metode dengan skrip yang telah disiapkan - bahan yang disiapkan dengan sangat baik dan mudah untuk dilacak kembali
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Kursus - Machine Learning – Data science
Diterjemahkan Mesin