Kerangka Materi

1. Penerapan Deep Reinforcement Learning

  • Apa itu Reinforcement Learning?
  • Perbedaan antara Supervised, Unsupervised, dan Reinforcement Learning
  • Aplikasi DRL pada tahun 2025 (robotika, kesehatan, keuangan, logistik)
  • Mengerti loop interaksi antara agen dan lingkungan

2. Dasar-Dasar Reinforcement Learning

  • Proses Keputusan Markov (MDP)
  • Negara, Tindakan, Reward, Kebijakan, dan Fungsi Nilai
  • Perbandingan antara eksplorasi dan ekspluatasi
  • Metode Monte Carlo dan Pembelajaran Temporal-Difference (TD)

3. Mengimplementasikan Algoritma RL Dasar

  • Metode tabel: Dynamic Programming, Evaluasi Kebijakan, dan Iterasi
  • Q-Learning dan SARSA
  • Strategi eksplorasi epsilon-greedy dan penyusutan
  • Mengimplementasikan lingkungan RL dengan OpenAI Gymnasium

4. Transisi ke Deep Reinforcement Learning

  • Batasan metode tabel
  • Menggunakan jaringan saraf untuk aproximasi fungsi
  • Arsitektur dan workflow Deep Q-Network (DQN)
  • Pengalaman ulang dan jaringan target

5. Algoritma DRL Lanjutan

  • Double DQN, Dueling DQN, dan Prioritized Experience Replay
  • Metode Gradien Kebijakan: algoritma REINFORCE
  • Arsitektur Actor-Critic (A2C, A3C)
  • Proximal Policy Optimization (PPO)
  • Soft Actor-Critic (SAC)

6. Bekerja dengan Ruang Tindakan Kontinu

  • Tantangan dalam pengendalian kontinu
  • Menggunakan DDPG (Deep Deterministic Policy Gradient)
  • Twin Delayed DDPG (TD3)

7. Alat dan Framework Praktis

  • Menggunakan Stable-Baselines3 dan Ray RLlib
  • Logging dan monitoring dengan TensorBoard
  • Tuning hyperparameter untuk model DRL

8. Reward Engineering dan Perancangan Lingkungan

  • Pembentukan reward dan keseimbangan denda
  • Konsep transfer learning dari simulasi ke realitas
  • Pembuatan lingkungan kustom di Gymnasium

9. Lingkungan yang Tidak Terlihat Secara Lengkap dan Generalisasi

  • Menangani informasi negara yang tidak lengkap (POMDPs)
  • Pendekatan berbasis memori menggunakan LSTMs dan RNNs
  • Meningkatkan keterbebasan dan generalisasi agen

10. Teori Permainan dan Multi-Agent Reinforcement Learning

  • Pengenalan lingkungan multi-agen
  • Kerjasama vs. kompetisi
  • Aplikasi dalam pelatihan antagonis dan optimasi strategi

11. Studi Kasus dan Aplikasi Dunia Nyata

  • Simulasi kendaraan bermotor otonom
  • Strategi perhitungan harga dan perdagangan keuangan
  • Robotika dan otomatisasi industri

12. Pengesan Masalah dan Optimasi

  • Mendiagnosis pelatihan yang tidak stabil
  • Mengelola keterkaitan reward dan overfitting
  • Mengskala model DRL di GPU dan sistem terdistribusi

13. Ringkasan dan Langkah Selanjutnya

  • Ringkasan arsitektur DRL dan algoritma kunci
  • Tren industri dan arah penelitian (misalnya, RLHF, model hibrid)
  • Sumber daya dan bahan bacaan lebih lanjut

Persyaratan

  • Kemampuan dalam pemrograman Python
  • Penguasaan Kalkulus dan Algebra Linier
  • Pemahaman dasar tentang Probabilitas dan Statistik
  • Pengalaman membangun model pemeraman mesin menggunakan Python dan NumPy atau TensorFlow/PyTorch

Penonton

  • Pengembang yang tertarik pada AI dan sistem cerdas
  • Ilmuwan Data yang mengeksplorasi kerangka kerja pemeraman balik
  • Insinyur Pemeraman Mesin yang bekerja dengan sistem otonom
 21 Jam

Jumlah Peserta


Biaya per Peserta

Testimoni (5)

Kursus Mendatang

Kategori Terkait