Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
Pengantar Reinforcement Learning
- Tinjauan umum pembelajaran penguatan dan penerapannya
- Perbedaan antara pembelajaran terbimbing, tanpa pengawasan, dan penguatan
- Konsep kunci: agen, lingkungan, penghargaan, dan kebijakan
Proses Keputusan Markov (MDP)
- Memahami status, tindakan, penghargaan, dan transisi status
- Fungsi nilai dan Persamaan Bellman
- Pemrograman dinamis untuk menyelesaikan MDP
Algoritma RL Inti
- Metode tabular: Q-Learning dan SARSA
- Metode berbasis kebijakan: algoritma REINFORCE
- Kerangka kerja Aktor-Kritikus dan aplikasinya
Dalam Reinforcement Learning
- Pengantar Jaringan Q Dalam (DQN)
- Rasakan tayangan ulang dan jaringan target
- Gradien kebijakan dan metode RL mendalam yang canggih
Kerangka Kerja dan Alat RL
- Pengenalan ke OpenAI Gym dan lingkungan RL lainnya
- Menggunakan PyTorch atau TensorFlow untuk pengembangan model RL
- Pelatihan, pengujian, dan pembandingan agen RL
Tantangan dalam kehidupan nyata
- Menyeimbangkan eksplorasi dan eksploitasi dalam pelatihan
- Berurusan dengan masalah penghargaan dan penugasan kredit yang jarang
- Scalatantangan kemampuan dan komputasi dalam RL
Praktik Langsung Activiti
- Menerapkan algoritma Q-Learning dan SARSA dari awal
- Melatih agen berbasis DQN untuk memainkan permainan sederhana di OpenAI Gym
- Menyempurnakan model RL untuk meningkatkan kinerja di lingkungan khusus
Ringkasan dan Langkah Berikutnya
Requirements
- Pemahaman yang kuat tentang prinsip dan algoritma pembelajaran mesin
- Kemampuan dalam Python pemrograman
- Keakraban dengan jaringan saraf dan kerangka kerja pembelajaran mendalam
Hadirin
- Insinyur pembelajaran mesin
- Spesialis AI
14 Hours
Testimonials (1)
Pelatih menjawab pertanyaan secara langsung.
Adrian
Course - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Machine Translated