Kerangka Materi

Perkenalan

  • Belajar melalui penguatan positif

Element dari Reinforcement Learning

Istilah Penting (Tindakan, Status, Hadiah, Kebijakan, Nilai, Nilai-Q, dll.)

Tinjauan Umum Metode Solusi Tabular

Membuat Agen Perangkat Lunak

Memahami Pendekatan Berbasis Nilai, Berbasis Kebijakan, dan Berbasis Model

Bekerja dengan Proses Keputusan Markov (MDP)

Bagaimana Kebijakan Menentukan Cara Berperilaku Agen

Menggunakan Metode Monte Carlo

Pembelajaran Perbedaan Temporal

n-langkah Bootstrapping

Metode Solusi Perkiraan

Prediksi Sesuai Kebijakan dengan Perkiraan

Kontrol Sesuai Kebijakan dengan Perkiraan

Metode di Luar Kebijakan dengan Aproksimasi

Memahami Jejak Kelayakan

Menggunakan Metode Gradien Kebijakan

Ringkasan dan Kesimpulan

Persyaratan

  • Pengalaman dengan pembelajaran mesin
  • Programming pengalaman

Hadirin

  • Ilmuwan data
 21 Jam

Jumlah Peserta


Biaya per Peserta

Kursus Mendatang

Kategori Terkait