Terima kasih telah mengirimkan pertanyaan Anda! Salah satu anggota tim kami akan segera menghubungi Anda.
Terima kasih telah mengirimkan pemesanan Anda! Salah satu anggota tim kami akan segera menghubungi Anda.
Kerangka Materi
Pengenalan terhadap Fine-Tuning DeepSeek LLM
- Tinjauan mengenai model DeepSeek, misalnya DeepSeek-R1 dan DeepSeek-V3
- Memahami kebutuhan untuk menyesuaikan LLM
- Perbandingan fine-tuning vs. teknik engineering promt
Menyiapkan Dataset untuk Fine-Tuning
- Mengumpulkan dataset yang spesifik untuk domain
- Teknik pra-pemrosesan dan membersihkan data
- Tokenisasi dan format dataset untuk DeepSeek LLM
Mempersiapkan Lingkungan Fine-Tuning
- Mengkonfigurasi percepatan GPU dan TPU
- Mengatur Hugging Face Transformers dengan DeepSeek LLM
- Memahami hiperparameter untuk fine-tuning
Menyesuaikan DeepSeek LLM
- Menerapkan fine-tuning terawasi
- Menggunakan LoRA (Low-Rank Adaptation) dan PEFT (Parameter-Efficient Fine-Tuning)
- Menjalankan fine-tuning terdistribusi untuk dataset berukuran besar
Menevaluasi dan Meningkatkan Model yang Telah Disesuaikan
- Menilai kinerja model dengan metrik penilaian
- Mengatasi overfitting dan underfitting
- Meningkatkan kecepatan inferensi dan efisiensi model
Mengimplementasikan Model DeepSeek yang Telah Disesuaikan
- Mengemas model untuk implementasi API
- Mengintegrasikan model yang telah disesuaikan ke dalam aplikasi
- Mengskalakan implementasi dengan komputasi awan dan tepi
Kasus Aplikasi dan Penggunaan di Dunia Nyata
- LLM yang telah disesuaikan untuk keuangan, kesehatan, dan dukungan pelanggan
- Studi kasus aplikasi industri
- Pertimbangan etika dalam model AI yang spesifik untuk domain
Ringkasan dan Langkah Selanjutnya
Persyaratan
- Pengalaman dengan framework machine learning dan deep learning
- Familiaritas dengan transformers dan large language models (LLMs)
- Pengertian tentang teknik data preprocessing dan model training
Target Penonton
- Peneliti AI yang menjelajahi fine-tuning LLM
- Insinyur machine learning yang mengembangkan model AI khusus
- Pengembang tingkat lanjut yang menerapkan solusi AI-driven
21 Jam