Kerangka Materi
Modul 1: Python Inti untuk Alur Kerja ML
• Peluncuran kursus dan penyiapan lingkungan
Menyelaraskan tujuan dan menyiapkan lingkungan kerja Python ML yang dapat direproduksi
• Esensi bahasa Python (jalur cepat)
Meninjau sintaks, kontrol alur, fungsi, dan pola yang umum digunakan dalam kodebase ML
• Struktur data untuk ML
Daftar, kamus, set, dan tupel untuk fitur, label, dan metadata
• Komprehensi dan alat fungsional
Mengekspresikan transformasi menggunakan komprehensi dan fungsi tingkat tinggi
• Python berorientasi objek untuk pengembang ML
Kelas, metode, komposisi, dan keputusan desain praktis
• dataclasses dan pemodelan ringan
Kontainer bertipe untuk konfigurasi, contoh, dan hasil
• Dekorator dan manajer konteks
Waktu, cache, log, dan pola eksekusi yang aman
• Bekerja dengan file dan jalur
Penanganan dataset yang robust dan format serialisasi
• Pengecualian dan pemrograman defensif
Menulis skrip ML yang gagal dengan aman dan transparan
• Modul, paket, dan struktur proyek
Mengorganisir kodebase ML yang dapat digunakan kembali
• Penyisipan tipe dan kualitas kode
Petunjuk tipe, dokumentasi, dan struktur yang ramah lint
Modul 2: Python Numerik, SciPy, dan Penanganan Data
• Dasar-dasar NumPy untuk komputasi vektorisasi
Operasi array yang efisien dan pemrograman yang memperhatikan kinerja
• Indeks, slicing, broadcasting, dan bentuk
Manipulasi tensor yang aman dan penalaran bentuk
• Esensi aljabar linier dengan NumPy dan SciPy
Operasi matriks yang stabil dan dekomposisi yang digunakan dalam ML
• Penyelaman mendalam SciPy
Statistik, optimisasi, fitting kurva, dan matriks langka
• Pandas untuk data tabel ML
Pembersihan, penggabungan, agregasi, dan persiapan dataset
• Penyelaman mendalam scikit-learn
Interface estimator, pipeline, dan alur kerja yang dapat direproduksi
• Esensi visualisasi
Plot diagnostik untuk eksplorasi data dan perilaku model
Modul 3: Pola Pemrograman untuk Membangun Aplikasi ML
• Dari notebook ke proyek yang dapat dipelihara
Refaktoring kode eksplorasi menjadi paket yang terstruktur
• Manajemen konfigurasi
Parameter eksternal dan validasi saat startup
• Logging, peringatan, dan observabilitas
Logging terstruktur untuk sistem ML yang dapat di-debug
• Komponen yang dapat digunakan kembali dengan OOP dan komposisi
Mendesain transformer dan predictor yang dapat diperluas
• Pola desain praktis
Pola Pipeline, Factory atau Registry, Strategy, dan Adapter
• Validasi data dan pemeriksaan skema
Mencegah masalah data yang diam-diam
• Kinerja dan profiling
Mengidentifikasi bottleneck dan menerapkan teknik optimisasi
• I/O model dan antarmuka inferensi
Persistensi yang aman dan antarmuka prediksi yang bersih
• Mini build ujung ke ujung
Pipelines ML gaya produksi dengan konfigurasi dan logging
Modul 4: Pembelajaran Statistik untuk Tabel, Teks, dan Gambar
• Dasar-dasar evaluasi
Pemisahan latihan dan validasi, validasi silang yang jujur, dan metrik yang sesuai bisnis
• Pembelajaran tabel lanjutan
Model GLM teratur, ensemble pohon, dan preprocessing yang bebas kebocoran
• Kalibrasi dan ketidakpastian
Skala Platt, regresi isotonik, bootstrap, dan prediksi konformal
• Metode NLP klasik
Perbandingan tokenisasi, TF-IDF, model linier, dan Naive Bayes
• Pemodelan topik
Dasar-dasar LDA dan batasan praktis
• Penglihatan komputer klasik
HOG, PCA, dan pipeline berbasis fitur
• Analisis kesalahan
Deteksi bias, kebisingan label, dan korelasi semu
• Laboratorium praktis
Pipeline tabel yang bebas kebocoran
Perbandingan baseline teks dan interpretasi
Baseline penglihatan klasik dengan analisis kegagalan yang terstruktur
Modul 5: Jaringan Saraf untuk Tabel, Teks, dan Gambar
• Penguasaan loop pelatihan
Loop PyTorch bersih dengan AMP, clipping, dan reproduktivitas
• Optimisasi dan regularisasi
Inisialisasi, normalisasi, optimiser, dan jadwal
• Presisi campuran dan penskalaan
Strategi akumulasi gradien dan checkpointing
• Jaringan saraf tabel
Embedding kategorikal, fitur silang, dan studi ablasi
• Jaringan saraf teks
Embedding, CNN, BiLSTM atau GRU, dan penanganan urutan
• Jaringan saraf penglihatan
Fundamentals CNN dan arsitektur gaya ResNet
• Laboratorium praktis
Kerangka pelatihan yang dapat digunakan kembali
Perbandingan NN tabel dengan boosting
CNN dengan augmentasi dan eksperimen jadwal
Modul 6: Arsitektur Jaringan Saraf Lanjutan
• Strategi transfer learning
Pola freeze dan unfreeze, tingkat belajar yang diskriminatif
• Arsitektur transformer untuk teks
Internal self-attention dan pendekatan fine-tuning
• Backbone penglihatan dan prediksi padat
ResNet, EfficientNet, Vision Transformers, dan konsep U-Net
• Arsitektur tabel lanjutan
TabTransformer, FT-Transformer, dan Deep and Cross networks
• Pertimbangan seri waktu
Pemisahan temporal dan deteksi pergeseran covariate
• Teknik efisiensi PEFT
Perbandingan LoRA, distillation, dan quantisation
• Laboratorium praktis
Fine-tuning model teks pra-latihan
Fine-tuning model penglihatan pra-latihan
Perbandingan transformator tabel dengan GBDT
Modul 7: Sistem AI Generatif
• Dasar-dasar penyerapan
Penyerapan terstruktur dan pembangkitan terkontrol
• Dasar-dasar LLM
Tokenisasi, tuning instruksi, dan mitigasi halusinasi
• Generasi Berbantuan Pemulihan
Chunking, embedding, pencarian hibrida, dan metrik evaluasi
• Strategi fine-tuning
LoRA dan QLoRA dengan kontrol kualitas data
• Model difusi
Intuisi difusi laten dan adaptasi praktis
• Data tabel sintetis
CTGAN dan pertimbangan privasi
• Laboratorium praktis
Aplikasi RAG gaya produksi
Validasi output terstruktur dengan penegakan skema
Eksperimen difusi opsional
Modul 8: Agen AI dan MCP
• Desain loop agen
Amati, rencanakan, tindakan, refleksi, dan persisten
• Arsitektur agen
ReAct, plan-and-execute, dan koordinasi multi-agen
• Manajemen memori
Pendekatan episodik, semantik, dan scratchpad
• Integrasi alat dan keamanan
Kontrak alat, sandboxing, dan pertahanan penyuntikan prompt
• Kerangka evaluasi
Jejak yang dapat direproduksi, suite tugas, dan pengujian regresi
• MCP dan interoperabilitas berbasis protokol
Mendesain server MCP dengan paparan alat yang aman
• Laboratorium praktis
Bangun agen dari awal
Paparkan alat melalui server gaya MCP
Buat harness evaluasi dengan batasan keamanan
Persyaratan
Peserta harus memiliki pengetahuan kerja tentang pemrograman Python.
Program ini ditujukan untuk profesional teknis tingkat menengah hingga lanjutan.
Testimoni (2)
ekosistem ML tidak hanya mencakup MLFlow tetapi juga Optuna, hyperops, Docker, dan Docker-Compose
Guillaume GAUTIER - OLEA MEDICAL
Kursus - MLflow
Diterjemahkan Mesin
Saya menikmati partisipasi dalam pelatihan Kubeflow yang diadakan secara jarak jauh. Pelatihan ini memungkinkan saya untuk mengonsolidasikan pengetahuan saya tentang layanan AWS, K8s, dan semua alat devOps di sekitar Kubeflow yang merupakan dasar-dasar yang diperlukan untuk menangani topik tersebut dengan tepat. Saya ingin berterima kasih kepada Malawski Marcin atas kesabaran dan profesionalismenya dalam pelatihan dan saran tentang praktik terbaik. Malawski mendekati topik dari berbagai sudut, menggunakan alat penyebaran yang berbeda seperti Ansible, EKS kubectl, dan Terraform. Sekarang saya yakin bahwa saya sedang masuk ke bidang aplikasi yang tepat.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Kursus - Kubeflow
Diterjemahkan Mesin