Kerangka Materi
1. Penerapan Deep Reinforcement Learning
- Apa itu Reinforcement Learning?
- Perbedaan antara Supervised, Unsupervised, dan Reinforcement Learning
- Aplikasi DRL pada tahun 2025 (robotika, kesehatan, keuangan, logistik)
- Mengerti loop interaksi antara agen dan lingkungan
2. Dasar-Dasar Reinforcement Learning
- Proses Keputusan Markov (MDP)
- Negara, Tindakan, Reward, Kebijakan, dan Fungsi Nilai
- Perbandingan antara eksplorasi dan ekspluatasi
- Metode Monte Carlo dan Pembelajaran Temporal-Difference (TD)
3. Mengimplementasikan Algoritma RL Dasar
- Metode tabel: Dynamic Programming, Evaluasi Kebijakan, dan Iterasi
- Q-Learning dan SARSA
- Strategi eksplorasi epsilon-greedy dan penyusutan
- Mengimplementasikan lingkungan RL dengan OpenAI Gymnasium
4. Transisi ke Deep Reinforcement Learning
- Batasan metode tabel
- Menggunakan jaringan saraf untuk aproximasi fungsi
- Arsitektur dan workflow Deep Q-Network (DQN)
- Pengalaman ulang dan jaringan target
5. Algoritma DRL Lanjutan
- Double DQN, Dueling DQN, dan Prioritized Experience Replay
- Metode Gradien Kebijakan: algoritma REINFORCE
- Arsitektur Actor-Critic (A2C, A3C)
- Proximal Policy Optimization (PPO)
- Soft Actor-Critic (SAC)
6. Bekerja dengan Ruang Tindakan Kontinu
- Tantangan dalam pengendalian kontinu
- Menggunakan DDPG (Deep Deterministic Policy Gradient)
- Twin Delayed DDPG (TD3)
7. Alat dan Framework Praktis
- Menggunakan Stable-Baselines3 dan Ray RLlib
- Logging dan monitoring dengan TensorBoard
- Tuning hyperparameter untuk model DRL
8. Reward Engineering dan Perancangan Lingkungan
- Pembentukan reward dan keseimbangan denda
- Konsep transfer learning dari simulasi ke realitas
- Pembuatan lingkungan kustom di Gymnasium
9. Lingkungan yang Tidak Terlihat Secara Lengkap dan Generalisasi
- Menangani informasi negara yang tidak lengkap (POMDPs)
- Pendekatan berbasis memori menggunakan LSTMs dan RNNs
- Meningkatkan keterbebasan dan generalisasi agen
10. Teori Permainan dan Multi-Agent Reinforcement Learning
- Pengenalan lingkungan multi-agen
- Kerjasama vs. kompetisi
- Aplikasi dalam pelatihan antagonis dan optimasi strategi
11. Studi Kasus dan Aplikasi Dunia Nyata
- Simulasi kendaraan bermotor otonom
- Strategi perhitungan harga dan perdagangan keuangan
- Robotika dan otomatisasi industri
12. Pengesan Masalah dan Optimasi
- Mendiagnosis pelatihan yang tidak stabil
- Mengelola keterkaitan reward dan overfitting
- Mengskala model DRL di GPU dan sistem terdistribusi
13. Ringkasan dan Langkah Selanjutnya
- Ringkasan arsitektur DRL dan algoritma kunci
- Tren industri dan arah penelitian (misalnya, RLHF, model hibrid)
- Sumber daya dan bahan bacaan lebih lanjut
Persyaratan
- Kemampuan dalam pemrograman Python
- Penguasaan Kalkulus dan Algebra Linier
- Pemahaman dasar tentang Probabilitas dan Statistik
- Pengalaman membangun model pemeraman mesin menggunakan Python dan NumPy atau TensorFlow/PyTorch
Penonton
- Pengembang yang tertarik pada AI dan sistem cerdas
- Ilmuwan Data yang mengeksplorasi kerangka kerja pemeraman balik
- Insinyur Pemeraman Mesin yang bekerja dengan sistem otonom
Testimoni (5)
Hunter luar biasa, sangat menarik, sangat berpengetahuan dan menarik. Bagus sekali.
Rick Johnson - Laramie County Community College
Kursus - Artificial Intelligence (AI) Overview
Diterjemahkan Mesin
Very flexible.
Frank Ueltzhoffer
Kursus - Artificial Neural Networks, Machine Learning and Deep Thinking
I liked the new insights in deep machine learning.
Josip Arneric
Kursus - Neural Network in R
Ann created a great environment to ask questions and learn. We had a lot of fun and also learned a lot at the same time.
Gudrun Bickelq
Kursus - Introduction to the use of neural networks
It was very interactive and more relaxed and informal than expected. We covered lots of topics in the time and the trainer was always receptive to talking more in detail or more generally about the topics and how they were related. I feel the training has given me the tools to continue learning as opposed to it being a one off session where learning stops once you've finished which is very important given the scale and complexity of the topic.