Kerangka Materi

Pendahuluan tentang Reinforcement Learning

  • Tinjauan tentang reinforcement learning dan aplikasinya
  • Perbedaan antara supervised, unsupervised, dan reinforcement learning
  • Konsep kunci: agent, lingkungan, reward, dan kebijakan

Markov Decision Processes (MDPs)

  • Memahami status, tindakan, reward, dan transisi status
  • Fungsi nilai dan Persamaan Bellman
  • Pemrograman dinamis untuk menyelesaikan MDPs

Algoritma RL Inti

  • Metode tabel: Q-Learning dan SARSA
  • Metode berbasis kebijakan: algoritma REINFORCE
  • Kerangka Actor-Critic dan aplikasinya

Deep Reinforcement Learning

  • Pendahuluan tentang Deep Q-Networks (DQN)
  • Pemasukan pengalaman dan jaringan target
  • Gradien kebijakan dan metode deep RL yang canggih

Kerangka dan Peralatan RL

  • Pendahuluan tentang OpenAI Gym dan lingkungan RL lainnya
  • Menggunakan PyTorch atau TensorFlow untuk pengembangan model RL
  • Melatih, menguji, dan membandingkan kinerja agent RL

Tantangan dalam RL

  • Mempertimbangkan eksplorasi dan eksploitasi dalam pelatihan
  • Mengatasi masalah reward yang langka dan masalah penugasan kredit
  • Skalabilitas dan tantangan komputasi dalam RL

Aktivitas Praktis

  • Mengimplementasikan algoritma Q-Learning dan SARSA dari awal
  • Melatih agent berbasis DQN untuk bermain game sederhana di OpenAI Gym
  • Menyempurnakan model RL untuk meningkatkan kinerja dalam lingkungan kustom

Ringkasan dan Langkah Selanjutnya

Persyaratan

  • Pemahaman yang kuat tentang prinsip dan algoritma pemelajaran mesin
  • Keterampilan dalam pemrograman Python
  • Kenyamanan dengan jaringan saraf dan framework deep learning

Peserta

  • Insinyur pemelajaran mesin
  • Spesialis AI
 14 Jam

Jumlah Peserta


Biaya per Peserta

Testimoni (1)

Kursus Mendatang

Kategori Terkait