Kerangka Materi

Dasar-dasar Sistem Agentik dalam Produksi

  • Arsitektur agen: loop, alat, memori, dan lapisan orkestrasi
  • Siklus hidup agen: pengembangan, penyebaran, dan operasi berkelanjutan
  • Tantangan manajemen agen skala produksi

Infrastruktur dan Model Penyebaran

  • Menyebarkan agen dalam lingkungan kontainer dan cloud
  • Pola penskalaan: penskalaan horizontal vs vertikal, konkurensi, dan throttling
  • Orkestrasi multi-agen dan keseimbangan beban kerja

Monitoring dan Observabilitas

  • Metrik utama: latency, tingkat keberhasilan, penggunaan memori, dan kedalaman panggilan agen
  • Pelacakan aktivitas agen dan grafik panggilan
  • Menerapkan observabilitas menggunakan Prometheus, OpenTelemetry, dan Grafana

Logging, Auditing, dan Kepatuhan

  • Pencatatan terpusat dan pengumpulan peristiwa struktur
  • Kepatuhan dan auditabilitas dalam alur kerja agenik
  • Merancang jejak audit dan mekanisme replay untuk debugging

Penyetelan Kinerja dan Optimasi Sumber Daya

  • Mengurangi overhead inferensi dan mengoptimalkan siklus orkestrasi agen
  • Penyimpanan model dan embbeding ringan untuk retrival yang lebih cepat
  • Pengujian beban dan skenario stres untuk pipa AI

Kontrol Biaya dan Tata Kelola

  • Memahami penggerak biaya agen: panggilan API, memori, komputasi, dan integrasi eksternal
  • Melacak biaya tingkat agen dan menerapkan model chargeback
  • Kebijakan otomatis untuk mencegah penyebaran agen dan konsumsi sumber daya idle

CI/CD dan Strategi Penyebaran untuk Agen

  • Mengintegrasikan pipa agen ke dalam sistem CI/CD
  • Pengujian, versi, dan strategi rollback untuk pembaruan agen iteratif
  • Penyeburan progresif dan mekanisme penyebaran yang aman

Pemulihan Kegagalan dan Reliability Engineering

  • Merancang untuk toleransi kesalahan dan degradasi yang elegan
  • Pola retry, timeout, dan circuit breaker untuk keandalan agen
  • Kerangka respons insiden dan post-mortem untuk operasi AI

Proyek Puncak

  • Membangun dan menyebar sistem AI agenik dengan pemantauan penuh dan pelacakan biaya
  • Menyimulasikan beban, mengukur kinerja, dan mengoptimalkan penggunaan sumber daya
  • Memresentasikan arsitektur akhir dan dashboard pemantauan kepada rekan

Ringkasan dan Langkah Selanjutnya

Persyaratan

  • Pemahaman kuat tentang MLOps dan sistem pembelajaran mesin produksi
  • Pengalaman dengan penyebaran kontainer (Docker/Kubernetes)
  • Kenalan dengan alat optimasi biaya cloud dan observabilitas

Audience

  • Insinyur MLOps
  • Site Reliability Engineers (SREs)
  • Manajer insinyur yang mengawasi infrastruktur AI
 21 jam

Jumlah Peserta


Harga per Peserta

Testimoni (3)

Kursus Mendatang

Kategori Terkait