Kerangka Materi
1. Penerapan Deep Reinforcement Learning
- Apa itu Reinforcement Learning?
- Perbedaan antara Supervised, Unsupervised, dan Reinforcement Learning
- Aplikasi DRL pada tahun 2025 (robotika, kesehatan, keuangan, logistik)
- Mengerti loop interaksi antara agen dan lingkungan
2. Dasar-Dasar Reinforcement Learning
- Proses Keputusan Markov (MDP)
- Negara, Tindakan, Reward, Kebijakan, dan Fungsi Nilai
- Perbandingan antara eksplorasi dan ekspluatasi
- Metode Monte Carlo dan Pembelajaran Temporal-Difference (TD)
3. Mengimplementasikan Algoritma RL Dasar
- Metode tabel: Dynamic Programming, Evaluasi Kebijakan, dan Iterasi
- Q-Learning dan SARSA
- Strategi eksplorasi epsilon-greedy dan penyusutan
- Mengimplementasikan lingkungan RL dengan OpenAI Gymnasium
4. Transisi ke Deep Reinforcement Learning
- Batasan metode tabel
- Menggunakan jaringan saraf untuk aproximasi fungsi
- Arsitektur dan workflow Deep Q-Network (DQN)
- Pengalaman ulang dan jaringan target
5. Algoritma DRL Lanjutan
- Double DQN, Dueling DQN, dan Prioritized Experience Replay
- Metode Gradien Kebijakan: algoritma REINFORCE
- Arsitektur Actor-Critic (A2C, A3C)
- Proximal Policy Optimization (PPO)
- Soft Actor-Critic (SAC)
6. Bekerja dengan Ruang Tindakan Kontinu
- Tantangan dalam pengendalian kontinu
- Menggunakan DDPG (Deep Deterministic Policy Gradient)
- Twin Delayed DDPG (TD3)
7. Alat dan Framework Praktis
- Menggunakan Stable-Baselines3 dan Ray RLlib
- Logging dan monitoring dengan TensorBoard
- Tuning hyperparameter untuk model DRL
8. Reward Engineering dan Perancangan Lingkungan
- Pembentukan reward dan keseimbangan denda
- Konsep transfer learning dari simulasi ke realitas
- Pembuatan lingkungan kustom di Gymnasium
9. Lingkungan yang Tidak Terlihat Secara Lengkap dan Generalisasi
- Menangani informasi negara yang tidak lengkap (POMDPs)
- Pendekatan berbasis memori menggunakan LSTMs dan RNNs
- Meningkatkan keterbebasan dan generalisasi agen
10. Teori Permainan dan Multi-Agent Reinforcement Learning
- Pengenalan lingkungan multi-agen
- Kerjasama vs. kompetisi
- Aplikasi dalam pelatihan antagonis dan optimasi strategi
11. Studi Kasus dan Aplikasi Dunia Nyata
- Simulasi kendaraan bermotor otonom
- Strategi perhitungan harga dan perdagangan keuangan
- Robotika dan otomatisasi industri
12. Pengesan Masalah dan Optimasi
- Mendiagnosis pelatihan yang tidak stabil
- Mengelola keterkaitan reward dan overfitting
- Mengskala model DRL di GPU dan sistem terdistribusi
13. Ringkasan dan Langkah Selanjutnya
- Ringkasan arsitektur DRL dan algoritma kunci
- Tren industri dan arah penelitian (misalnya, RLHF, model hibrid)
- Sumber daya dan bahan bacaan lebih lanjut
Persyaratan
- Kemampuan dalam pemrograman Python
- Penguasaan Kalkulus dan Algebra Linier
- Pemahaman dasar tentang Probabilitas dan Statistik
- Pengalaman membangun model pemeraman mesin menggunakan Python dan NumPy atau TensorFlow/PyTorch
Penonton
- Pengembang yang tertarik pada AI dan sistem cerdas
- Ilmuwan Data yang mengeksplorasi kerangka kerja pemeraman balik
- Insinyur Pemeraman Mesin yang bekerja dengan sistem otonom
Testimoni (3)
Saya sangat menyukai bagian akhir di mana kita menghabiskan waktu untuk bermain dengan CHAT GPT. Ruangan tidak disiapkan dengan baik untuk ini—sebaiknya menggunakan beberapa meja kecil agar kita bisa berkumpul dalam kelompok-kelompok kecil dan melakukan brainstorming, daripada satu meja besar.
Nola - Laramie County Community College
Kursus - Artificial Intelligence (AI) Overview
Diterjemahkan Mesin
Bekerja berdasarkan prinsip-prinsip dasar secara fokus, dan beralih ke penerapan studi kasus pada hari yang sama
Maggie Webb - Department of Jobs, Regions, and Precincts
Kursus - Artificial Neural Networks, Machine Learning, Deep Thinking
Diterjemahkan Mesin
Bahwa itu menggunakan data perusahaan nyata. Instruktur memiliki pendekatan yang sangat baik dengan membuat peserta pelatihan berpartisipasi dan bersaing
Jimena Esquivel - Zaklad Uslugowy Hakoman Andrzej Cybulski
Kursus - Applied AI from Scratch in Python
Diterjemahkan Mesin