Kerangka Materi

Pengantar ke Reinforcement Learning

  • Apa itu pembelajaran dengan pengetokan (reinforcement learning)?
  • Konsep kunci: agen, lingkungan, state, tindakan, dan imbalan
  • Tantangan dalam pembelajaran dengan pengetokan

Eksplorasi dan Eksploitasi

  • Mengatur keseimbangan antara eksplorasi dan eksploitasi pada model RL
  • Strategi eksplorasi: epsilon-greedy, softmax, dan lebih banyak lagi

Q-Learning dan Jaringan Q-Dalam (DQNs)

  • Pengantar ke Q-learning
  • Menerapkan DQN menggunakan TensorFlow
  • Memaksimalkan Q-learning dengan ulang pengalaman dan jaringan target

Metode Berbasis Kebijakan (Policy-Based Methods)

  • Algoritma gradien kebijakan
  • Algoritme REINFORCE dan implementasinya
  • Metode aktor-kritik (actor-critic methods)

Bekerja dengan OpenAI Gym

  • Menyiapkan lingkungan di OpenAI Gym
  • Mem-simulasikan agen dalam lingkungan dinamis
  • Mengevaluasi kinerja agen

Teknik Lanjutan Reinforcement Learning

  • Pembelajaran dengan pengetokan multi-agen (multi-agent reinforcement learning)
  • Gradien kebijakan deterministik dalam yang dalam (Deep Deterministic Policy Gradient, DDPG)
  • Optimasi kebijakan dekat (Proximal Policy Optimization, PPO)

Mendeploy Model Reinforcement Learning

  • Aplikasi dunia nyata dari pembelajaran dengan pengetokan
  • Integrasi model RL ke lingkungan produksi

Ringkasan dan Langkah Berikutnya

Persyaratan

  • Pengalaman dengan Python programming
  • Pemahaman dasar tentang konsep deep learning dan machine learning
  • Pengetahuan tentang algoritma dan konsep matematika yang digunakan dalam reinforcement learning

Audience

  • Data scientist
  • Praktisi machine learning
  • Peneliti AI
 28 Jam

Jumlah Peserta


Biaya per Peserta

Kursus Mendatang

Kategori Terkait