Kursus Pelatihan Fine-Tuning dengan Reinforcement Learning dari Umpan Balik Manusia (RLHF)
Reinforcement Learning dari Human Feedback (RLHF) adalah metode terkini yang digunakan untuk fine-tuning model seperti ChatGPT dan sistem AI kelas atas lainnya.
Pelatihan langsung ini (daring atau tatap muka) ditujukan bagi insinyur pembelajaran mesin tingkat lanjut dan peneliti AI yang ingin menerapkan RLHF untuk fine-tuning model AI besar demi performa, keselamatan, dan keterpaduan yang lebih baik.
Selesai mengikuti pelatihan ini, peserta akan dapat:
- Mengerti fondasi teoretis dari RLHF dan mengapa hal tersebut penting dalam pengembangan AI modern.
- Melaksanakan model reward berdasarkan umpan balik manusia untuk memandu proses pembelajaran reformentasi.
- Menyesuaikan model bahasa besar menggunakan teknik RLHF agar keluarannya sesuai dengan preferensi manusia.
- Menerapkan praktik terbaik untuk menskalakan alur kerja RLHF pada sistem AI tingkat produksi.
Format Kursus
- Lecture interaktif dan diskusi.
- Banyak latihan dan praktek.
- Pelaksanaan langsung dalam lingkungan laboratorium live.
Opsi Pemaduan Kursus
- Untuk meminta pelatihan yang disesuaikan untuk kursus ini, silakan hubungi kami untuk mengatur hal tersebut.
Kerangka Materi
Pengantar ke Reinforcement Learning dari Umpan Balik Manusia (RLHF)
- Apa itu RLHF dan mengapa hal tersebut penting
- Perbandingan dengan metode fine-tuning berbasis pengawasan
- Aplikasi RLHF dalam sistem AI modern
Pemodelan Hadiah dengan Umpan Balik Manusia
- Mengumpulkan dan mengstrukturkan umpan balik manusia
- Membangun dan melatih model hadiah
- Evaluasi efektivitas model hadiah
Latihan dengan Optimisasi Kebijakan Proksimal (PPO)
- Ringkasan algoritma PPO untuk RLHF
- Melaksanakan PPO dengan model hadiah
- Mengoptimalkan model secara iteratif dan aman
Aplikasi Praktis Model Bahasa
- Menyiapkan dataset untuk alur kerja RLHF
- Praktek fine-tuning LLM kecil menggunakan RLHF
- Tantangan dan strategi mitigasi
Meningkatkan Skala RLHF ke Sistem Produksi
- Pertimbangan infrastruktur dan komputasi
- Penjaminan kualitas dan siklus umpan balik berkelanjutan
- Praktik terbaik untuk implementasi dan pemeliharaan
Pertimbangan Etika dan Mitigasi Bias
- Mengatasi risiko etika dalam umpan balik manusia
- Stra tegi deteksi dan koreksi bias
- Menjamin aliansi dan output aman
Studi Kasus dan Contoh Nyata
- Studi kasus: Fine-tuning ChatGPT dengan RLHF
- Penerapan RLHF yang sukses lainnya
- Lessons learned dan wawasan industri
Rangkuman dan Langkah Selanjutnya
Persyaratan
- Pemahaman tentang dasar-dasar pembelajaran bersupervisi dan pembelajaran berincentif
- Pengalaman dengan penyetelan model dan arsitektur jaringan saraf
- Ketahui tentang Python pemrograman dan kerangka kerja pembelajaran dalam (misalnya, TensorFlow, PyTorch)
Audience
- Insinyur Machine Learning
- Peneliti AI
Kursus Pelatihan Terbuka membutuhkan minimal 5 peserta.
Kursus Pelatihan Fine-Tuning dengan Reinforcement Learning dari Umpan Balik Manusia (RLHF) - Pemesanan
Kursus Pelatihan Fine-Tuning dengan Reinforcement Learning dari Umpan Balik Manusia (RLHF) - Penyelidikan
Fine-Tuning dengan Reinforcement Learning dari Umpan Balik Manusia (RLHF) - Permintaan Konsultasi
Kursus Mendatang
Kursus Terkait
Pengenalan Fine-Tuning & Manajemen Prompt Lanjut di Vertex AI
14 JamVertex AI menyediakan alat-alat canggih untuk menyesuaikan (fine-tuning) model besar dan mengelola prompt, memungkinkan pengembang dan tim data untuk memaksimalkan akurasi model, menyederhanakan alur kerja iterasi, dan memastikan ketatnya evaluasi dengan menggunakan perpustakaan dan layanan yang tersedia.
Pelatihan ini dibimbing instruktur dan dapat dilakukan secara online langsung atau pelatihan langsung tatap muka dan ditujukan untuk praktisioner tingkat menengah hingga mahir yang ingin meningkatkan kinerja dan keandalan aplikasi AI generatif menggunakan fine-tuning terawasi, manajemen versi prompt, dan layanan evaluasi di Vertex AI.
Di akhir pelatihan ini, peserta akan mampu:
- Menerapkan teknik fine-tuning terawasi pada model Gemini di Vertex AI.
- Mengimplementasikan alur kerja manajemen prompt termasuk versioning dan testing.
- Memanfaatkan perpustakaan evaluasi untuk menilai dan memaksimalkan kinerja AI.
- Mengirimkan dan memantau model yang ditingkatkan dalam lingkungan produksi.
Format Kursus
- Diskusi dan perkuliahan interaktif.
- Laboratorium praktis dengan alat fine-tuning dan prompt Vertex AI.
- Studi kasus optimasi model perusahaan.
Opsi Kustomisasi Kursus
- Untuk meminta pelatihan yang disesuaikan untuk kursus ini, silakan hubungi kami untuk mengatur.
Teknik Lanjutan dalam Transfer Learning
14 JamPelatihan langsung yang dipandu instruktur di Indonesia (online atau di tempat) ini ditujukan untuk profesional pembelajaran mesin tingkat lanjut yang ingin menguasai teknik pembelajaran transfer mutakhir dan menerapkannya pada masalah dunia nyata yang kompleks.
Pada akhir pelatihan ini, peserta akan dapat:
- Memahami konsep dan metodologi lanjutan dalam pembelajaran transfer.
- Menerapkan teknik adaptasi spesifik domain untuk model yang telah dilatih sebelumnya.
- Terapkan pembelajaran berkelanjutan untuk mengelola tugas dan kumpulan data yang terus berkembang.
- Kuasai penyempurnaan multitugas untuk meningkatkan kinerja model di seluruh tugas.
Continual Learning and Model Update Strategies for Fine-Tuned Models
14 JamPelatihan langsung yang dipimpin instruktur di Indonesia (daring atau tatap muka) ini ditujukan untuk insinyur pemeliharaan AI tingkat lanjut dan profesional MLOps yang ingin mengimplementasikan pipa kerja pembelajaran berkelanjutan yang kuat dan strategi pembaruan efektif untuk model yang telah diterapkan dan disesuaikan.
Selesai pelatihan ini, peserta akan dapat:
- Mendesain dan mengimplementasikan alur kerja pembelajaran berkelanjutan untuk model yang sudah diterapkan.
- Mengurangi lupa keterlaluan melalui pelatihan yang tepat dan manajemen memori.
- Memotomatisasi pemantauan dan pemicu pembaruan berdasarkan pergeseran model atau perubahan data.
- Mengintegrasikan strategi pembaruan model ke dalam pipa CI/CD yang ada dan MLOps.
Men-deploy Fine-Tuned Models di Produksi
21 JamPelatihan langsung yang dipandu instruktur di Indonesia (online atau di tempat) ini ditujukan untuk profesional tingkat lanjut yang ingin menerapkan model yang disetel dengan baik secara andal dan efisien.
Pada akhir pelatihan ini, peserta akan dapat:
- Memahami tantangan dalam menerapkan model yang disesuaikan ke dalam produksi.
- Kontainerisasi dan terapkan model menggunakan alat seperti Docker dan Kubernetes.
- Terapkan pemantauan dan pencatatan untuk model yang diterapkan.
- Optimalkan model untuk latensi dan skalabilitas dalam skenario dunia nyata.
Domain-Specific Fine-Tuning for Finance
21 JamPelatihan langsung yang dipimpin instruktur di Indonesia (online atau di tempat) ini ditujukan untuk profesional tingkat menengah yang ingin memperoleh keterampilan praktis dalam menyesuaikan model AI untuk tugas keuangan penting.
Pada akhir pelatihan ini, peserta akan dapat:
- Memahami dasar-dasar penyempurnaan untuk aplikasi keuangan.
- Memanfaatkan model yang telah dilatih sebelumnya untuk tugas-tugas spesifik domain dalam keuangan.
- Terapkan teknik untuk deteksi penipuan, penilaian risiko, dan pembuatan saran keuangan.
- Pastikan kepatuhan terhadap peraturan keuangan seperti GDPR dan SOX.
- Terapkan keamanan data dan praktik AI yang etis dalam aplikasi keuangan.
Fine-Tuning Models and Large Language Models (LLMs)
14 JamPelatihan langsung yang dipandu instruktur di Indonesia (online atau di tempat) ini ditujukan untuk profesional tingkat menengah hingga tingkat lanjut yang ingin menyesuaikan model terlatih untuk tugas dan kumpulan data tertentu.
Pada akhir pelatihan ini, peserta akan dapat:
- Memahami prinsip fine-tuning dan penerapannya.
- Siapkan kumpulan data untuk menyempurnakan model yang telah dilatih sebelumnya.
- Menyempurnakan model bahasa besar (LLM) untuk tugas NLP.
- Mengoptimalkan kinerja model dan mengatasi tantangan umum.
Efisien Fine-Tuning dengan Low-Rank Adaptation (LoRA)
14 JamPelatihan langsung yang dipimpin instruktur di Indonesia (online atau di tempat) ini ditujukan untuk pengembang tingkat menengah dan praktisi AI yang ingin menerapkan strategi penyempurnaan untuk model besar tanpa memerlukan sumber daya komputasi yang besar.
Pada akhir pelatihan ini, peserta akan dapat:
- Memahami prinsip Adaptasi Tingkat Rendah (LoRA).
- Terapkan LoRA untuk penyempurnaan model besar yang efisien.
- Mengoptimalkan penyempurnaan untuk lingkungan dengan keterbatasan sumber daya.
- Mengevaluasi dan menerapkan model yang disesuaikan LoRA untuk aplikasi praktis.
Pemodelan Ulang Model Multimodal
28 JamPelatihan langsung yang dipandu instruktur di Indonesia (online atau di tempat) ini ditujukan untuk profesional tingkat lanjut yang ingin menguasai penyempurnaan model multimoda untuk solusi AI yang inovatif.
Pada akhir pelatihan ini, peserta akan dapat:
- Memahami arsitektur model multimoda seperti CLIP dan Flamingo.
- Menyiapkan dan memproses terlebih dahulu kumpulan data multimoda secara efektif.
- Menyempurnakan model multimoda untuk tugas tertentu.
- Mengoptimalkan model untuk aplikasi dan kinerja dunia nyata.
Fine-Tuning untuk Natural Language Processing (NLP)
21 JamPelatihan langsung yang dipandu instruktur dalam Indonesia (online atau di tempat) ini ditujukan untuk profesional tingkat menengah yang ingin meningkatkan proyek NLP mereka melalui penyempurnaan model bahasa yang telah dilatih sebelumnya secara efektif.
Pada akhir pelatihan ini, peserta akan dapat:
- Memahami dasar-dasar penyempurnaan untuk tugas-tugas NLP.
- Menyempurnakan model yang telah dilatih sebelumnya seperti GPT, BERT, dan T5 untuk aplikasi NLP tertentu.
- Optimalkan hiperparameter untuk meningkatkan kinerja model.
- Mengevaluasi dan menerapkan model yang disempurnakan pada skenario dunia nyata.
Pemilihan AI untuk Layanan Keuangan: Prediksi Risiko dan Deteksi Penipuan
14 JamPelatihan ini dipandu instruktur (pelatihan online langsung atau tatap muka) ditujukan untuk data scientist dan insinyur AI tingkat lanjut di sektor keuangan yang ingin melakukan pemilihan model untuk aplikasi seperti penilaian kredit, deteksi penipuan, dan pemodelan risiko menggunakan data keuangan spesifik domain.
Pada akhir pelatihan ini, peserta akan mampu:
- Melakukan pemilihan model AI pada dataset keuangan untuk meningkatkan prediksi penipuan dan risiko.
- Mengaplikasikan teknik seperti transfer learning, LoRA, dan regularisasi untuk meningkatkan efisiensi model.
- Mengintegrasikan pertimbangan kepatuhan keuangan ke dalam alur kerja pemodelan AI.
- Menyebarkan model yang telah dipilih untuk digunakan produksi di platform layanan keuangan.
Penyetelan Ulang AI untuk Kesehatan: Diagnosa Medis dan Analitik Prediktif
14 JamPelatihan langsung ini dipimpin instruktur (online atau tatap muka) ditujukan kepada pengembang AI medis dan ilmuwan data tingkat menengah hingga tingkat lanjut yang ingin menyetel ulang model untuk diagnosis klinis, prediksi penyakit, dan peramalan hasil pasien menggunakan data medis struktural dan tidak terstruktur.
Pada akhir pelatihan ini, peserta akan mampu:
- Menyetel ulang model AI pada dataset kesehatan termasuk EMRs, pencitraan, dan data time-series.
- Menerapkan transfer learning, adaptasi domain, dan kompresi model dalam konteks medis.
- Menangani privasi, bias, dan kepatuhan regulasi dalam pengembangan model.
- Menerapkan dan memantau model yang telah disetel ulang di lingkungan kesehatan nyata.
Fine-Tuning DeepSeek LLM untuk Model AI Kustom
21 JamPelatihan ini, yang dipimpin instruktur secara langsung (online atau tatap muka), ditujukan untuk peneliti AI tingkat lanjut, insinyur mesin pembelajaran dan pengembang yang ingin menyempurnakan model DeepSeek LLM untuk menciptakan aplikasi AI khusus yang disesuaikan dengan industri, domain, atau kebutuhan bisnis tertentu.
Di akhir pelatihan ini, peserta akan mampu:
- Memahami arsitektur dan kemampuan model DeepSeek, termasuk DeepSeek-R1 dan DeepSeek-V3.
- Menyiapkan dataset dan memproses data untuk menyempurnakan.
- Menyempurnakan DeepSeek LLM untuk aplikasi domain khusus.
- Mengoptimasi dan men-deploy model yang disempurnakan secara efisien.
Fine-Tuning Defense AI for Autonomous Systems and Surveillance
14 JamPelatihan ini, yang dibimbing instruktur, dilakukan secara online atau tatap muka dan ditujukan untuk insinyur AI pertahanan tingkat lanjut serta pengembang teknologi militer yang ingin menyesuaikan model deep learning untuk digunakan pada kendaraan otonom, drone, dan sistem pengawasan sambil memenuhi standar keamanan dan ketahanan yang ketat.
Pada akhir pelatihan ini, peserta akan mampu:
- Menyesuaikan model penglihatan komputer dan fusi sensor untuk tugas pengawasan dan penargetan.
- Menyesuaikan sistem AI otonom dengan lingkungan dan profil misi yang berubah.
- Menerapkan mekanisme validasi dan jaga-jaga yang kokoh dalam pipa model.
- Memastikan kesesuaian dengan standar keterangan, keselamatan, dan keamanan khusus pertahanan.
Penyetelan Ulang Model AI Hukum: Peninjauan Kontrak dan Riset Hukum
14 JamPelatihan ini dipandu instruktur (online atau tatap muka) ditujukan untuk insinyur teknologi hukum dan pengembang AI tingkat menengah yang ingin melakukan penyetelan ulang model bahasa untuk tugas seperti analisis kontrak, ekstraksi klausul, dan riset hukum otomatis dalam lingkungan layanan hukum.
Pada akhir pelatihan ini, peserta akan mampu:
- Menyiapkan dan membersihkan dokumen hukum untuk penyetelan ulang model NLP.
- Menerapkan strategi penyetelan ulang untuk meningkatkan akurasi model pada tugas-tugas hukum.
- Menyebarkan model untuk membantu dengan peninjauan kontrak, klasifikasi, dan riset.
- Memastikan kepatuhan, auditabilitas, dan pelacakabilitas output AI dalam konteks hukum.
Fine-Tuning Large Language Models Menggunakan QLoRA
14 JamPelatihan berorientasi instruktur ini di Indonesia (daring atau tatap muka) ditujukan untuk insinyur pembelajaran mesin tingkat menengah hingga lanjutan, pengembang AI, dan ilmuwan data yang ingin belajar cara menggunakan QLoRA untuk mengoptimalkan model besar secara efisien untuk tugas spesifik dan kustomisasi.
Selesai pelatihan ini, peserta akan dapat:
- Mengerti teori di balik QLoRA dan teknik kuantifikasi untuk LLM (Large Language Models).
- Melaksanakan QLoRA dalam pengoptimalan model bahasa besar untuk aplikasi spesifik domain.
- Memaksimalkan performa pengoptimalan pada sumber daya komputasional terbatas menggunakan kuantifikasi.
- Mengimplementasikan dan mengevaluasi model yang dioptimalkan dalam aplikasi dunia nyata secara efisien.