Kerangka Materi
Pengantar Machine Learning
-
Jenis-jenis machine learning – terawasi vs tidak terawasi
-
Dari pembelajaran statistik ke machine learning
-
Alur kerja data mining: pemahaman bisnis, persiapan data, pemodelan, penyebaran
-
Memilih algoritma yang tepat untuk tugas
-
Overfitting dan tradeoff bias-variansi
Gambaran Umum Python dan Perpustakaan ML
-
Mengapa menggunakan bahasa pemrograman untuk ML
-
Memilih antara R dan Python
-
Penjelasan singkat Python dan Jupyter Notebooks
-
Perpustakaan Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Pengujian dan Evaluasi Algoritma ML
-
Generalisasi, overfitting, dan validasi model
-
Strategi evaluasi: holdout, cross-validation, bootstrapping
-
Metrik untuk regresi: ME, MSE, RMSE, MAPE
-
Metrik untuk klasifikasi: akurasi, matriks kebingungan, kelas tidak seimbang
-
Visualisasi kinerja model: kurva profit, kurva ROC, kurva lift
-
Seleksi model dan pencarian grid untuk penyesuaian
Persiapan Data
-
Impor dan penyimpanan data di Python
-
Analisis eksplorasi dan statistik ringkasan
-
Penanganan nilai yang hilang dan outlier
-
Standarisasi, normalisasi, dan transformasi
-
Pengkodean data kualitatif dan pengolahan data dengan pandas
Algoritma Klasifikasi
-
Klasifikasi biner vs multikelas
-
Regresi logistik dan fungsi diskriminasi
-
Naïve Bayes, k-nearest neighbors
-
Pohon keputusan: CART, Random Forests, Bagging, Boosting, XGBoost
-
Support Vector Machines dan kernel
-
Teknik pembelajaran ensemble
Regresi dan Prediksi Numerik
-
Kuadrat terkecil dan seleksi variabel
-
Metode regularisasi: L1, L2
-
Regresi polinomial dan model nonlinier
-
Pohon regresi dan splines
Jaringan Saraf
-
Pengenalan jaringan saraf dan pembelajaran mendalam
-
Fungsi aktivasi, lapisan, dan backpropagation
-
Multilayer perceptrons (MLP)
-
Menggunakan TensorFlow atau PyTorch untuk pemodelan jaringan saraf dasar
-
Jaringan saraf untuk klasifikasi dan regresi
Peramalan Penjualan dan Analisis Prediktif
-
Peramalan berbasis deret waktu vs regresi
-
Penanganan data musiman dan tren
-
Membangun model peramalan penjualan menggunakan teknik ML
-
Evaluasi akurasi peramalan dan ketidakpastian
-
Interpretasi bisnis dan komunikasi hasil
Pembelajaran Tidak Terawasi
-
Teknik klastering: k-means, k-medoids, clustering hierarkis, SOMs
-
Reduksi dimensi: PCA, analisis faktor, SVD
-
Skala multidimensi
Penambangan Teks
-
Pra-pemrosesan dan tokenisasi teks
-
Bag-of-words, stemming, dan lemmatisasi
-
Analisis sentimen dan frekuensi kata
-
Visualisasi data teks dengan awan kata
Sistem Rekomendasi
-
Filtering kolaboratif berbasis pengguna dan item
-
Desain dan evaluasi mesin rekomendasi
Penambangan Pola Asosiasi
-
Itemset frekuensi dan algoritma Apriori
-
Analisis keranjang belanja dan rasio lift
Deteksi Outlier
-
Analisis nilai ekstrem
-
Metode berbasis jarak dan kepadatan
-
Deteksi outlier dalam data berdimensi tinggi
Studi Kasus Machine Learning
-
Memahami masalah bisnis
-
Persiapan data dan feature engineering
-
Seleksi model dan penyesuaian parameter
-
Evaluasi dan penyajian temuan
-
Penyebaran
Ringkasan dan Langkah Selanjutnya
Persyaratan
-
Pengetahuan dasar tentang konsep machine learning seperti pembelajaran terawasi dan tidak terawasi
-
Keterampilan pemrograman Python (variabel, loop, fungsi)
-
Pengalaman dalam penanganan data menggunakan perpustakaan seperti pandas atau NumPy sangat membantu tetapi tidak diperlukan
-
Tidak diharapkan pengalaman sebelumnya dengan pemodelan lanjutan atau jaringan saraf
Audience
-
Data scientists
-
Analis bisnis
-
Insinyur perangkat lunak dan profesional teknis yang bekerja dengan data
Testimoni (2)
ekosistem ML tidak hanya mencakup MLFlow tetapi juga Optuna, hyperops, Docker, dan Docker-Compose
Guillaume GAUTIER - OLEA MEDICAL
Kursus - MLflow
Diterjemahkan Mesin
Saya menikmati partisipasi dalam pelatihan Kubeflow yang diadakan secara jarak jauh. Pelatihan ini memungkinkan saya untuk mengonsolidasikan pengetahuan saya tentang layanan AWS, K8s, dan semua alat devOps di sekitar Kubeflow yang merupakan dasar-dasar yang diperlukan untuk menangani topik tersebut dengan tepat. Saya ingin berterima kasih kepada Malawski Marcin atas kesabaran dan profesionalismenya dalam pelatihan dan saran tentang praktik terbaik. Malawski mendekati topik dari berbagai sudut, menggunakan alat penyebaran yang berbeda seperti Ansible, EKS kubectl, dan Terraform. Sekarang saya yakin bahwa saya sedang masuk ke bidang aplikasi yang tepat.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Kursus - Kubeflow
Diterjemahkan Mesin