Hubungi Kami

Kerangka Materi

Mempersiapkan Model Machine Learning untuk Penyebaran

  • Mengemas model dengan Docker
  • Ekspor model dari TensorFlow dan PyTorch
  • Pertimbangan versioning dan penyimpanan

Penyajian Model di Kubernetes

  • Ikhtisar server inference
  • Menyiapkan TensorFlow Serving dan TorchServe
  • Menyiapkan endpoint model

Teknik Optimasi Inference

  • Strategi batching
  • Penganganan permintaan secara bersamaan
  • Penalaan latency dan throughput

Autoscaling Beban Kerja ML

  • Horizontal Pod Autoscaler (HPA)
  • Vertical Pod Autoscaler (VPA)
  • Kubernetes Event-Driven Autoscaling (KEDA)

Provisioning GPU dan Manajemen Sumber Daya

  • Konfigurasi node GPU
  • Ikhtisar plugin perangkat NVIDIA
  • Permintaan dan batas sumber daya untuk beban kerja ML

Strategi Rollout dan Rilis Model

  • Deployment blue/green
  • Pattern rollout canary
  • Pengujian A/B untuk evaluasi model

Monitoring dan Observabilitas untuk ML dalam Produksi

  • Metrik untuk beban kerja inference
  • Praktik logging dan tracing
  • Dashboard dan alerting

Pertimbangan Keamanan dan Keandalan

  • Keamanan endpoint model
  • Network policies dan akses kontrol
  • Memastikan ketersediaan tinggi

Ringkasan dan Langkah Selanjutnya

Persyaratan

  • Pemahaman tentang alur kerja aplikasi containerized
  • Pengalaman dengan model machine learning berbasis Python
  • Kepahaman dasar-dasar Kubernetes

Audience

  • Insinyur ML
  • Insinyur DevOps
  • Tim rekayasa platform
 14 Jam

Jumlah Peserta


Harga per Peserta

Testimoni (3)

Kursus Mendatang

Kategori Terkait