Terima kasih telah mengirimkan pertanyaan Anda! Salah satu anggota tim kami akan segera menghubungi Anda.
Terima kasih telah mengirimkan pemesanan Anda! Salah satu anggota tim kami akan segera menghubungi Anda.
Kerangka Materi
Perkenalan
- Belajar melalui penguatan positif
Element dari Reinforcement Learning
Istilah Penting (Tindakan, Status, Hadiah, Kebijakan, Nilai, Nilai-Q, dll.)
Tinjauan Umum Metode Solusi Tabular
Membuat Agen Perangkat Lunak
Memahami Pendekatan Berbasis Nilai, Berbasis Kebijakan, dan Berbasis Model
Bekerja dengan Proses Keputusan Markov (MDP)
Bagaimana Kebijakan Menentukan Cara Berperilaku Agen
Menggunakan Metode Monte Carlo
Pembelajaran Perbedaan Temporal
n-langkah Bootstrapping
Metode Solusi Perkiraan
Prediksi Sesuai Kebijakan dengan Perkiraan
Kontrol Sesuai Kebijakan dengan Perkiraan
Metode di Luar Kebijakan dengan Aproksimasi
Memahami Jejak Kelayakan
Menggunakan Metode Gradien Kebijakan
Ringkasan dan Kesimpulan
Persyaratan
- Pengalaman dengan pembelajaran mesin
- Programming pengalaman
Hadirin
- Ilmuwan data
21 Jam