Kerangka Materi

Pengenalan ke AIOps

  • Apa itu AIOps dan mengapa penting
  • Monitoring tradisional vs. observabilitas berbasis AIOps
  • Arsitektur AIOps dan komponen utama

Pengumpulan dan Normalisasi Data Operasional

  • Jenis data observabilitas: metrik, log, dan jejak
  • Memasukkan data dari sumber yang berbeda (server, kontainer, cloud)
  • Menggunakan agen dan ekspor (Prometheus, Beats, Fluentd)

Korelasi Data dan Deteksi Anomali

  • Korelasi serangkaian waktu dan metode statistik
  • Menggunakan model ML untuk deteksi anomali
  • Mendeteksi insiden di sistem terdistribusi

Pengingat dan Pengurangan Kebisingan

  • Merancang aturan pengingat cerdas dan ambang batas
  • Penekanan, deduplikasi, dan kelompok pengingat
  • Integrasi dengan Alertmanager, Slack, PagerDuty, atau Opsgenie

Analisis Penyebab Akar dan Visualisasi

  • Menggunakan dashboard untuk memvisualisasikan metrik dan mendeteksi tren
  • Menelusuri peristiwa dan timeline untuk analisis penyebab akar
  • Melacak masalah di berbagai lapisan dengan alat tracing terdistribusi

Otomatisasi dan Perbaikan

  • Memicu skrip atau workflow otomatis dari insiden
  • Integrasi dengan sistem ITSM (ServiceNow, Jira)
  • Kasus penggunaan: penyembuhan sendiri, penskalaan, pengeleman lalu lintas

Platform AIOps Open Source dan Komersial

  • Gambaran umum alat: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Kriteria evaluasi untuk memilih platform AIOps
  • Demo dan praktik langsung dengan tumpukan yang dipilih

Ringkasan dan Langkah Selanjutnya

Persyaratan

  • Memahami konsep operasi IT dan monitoring sistem
  • Pengalaman dengan alat atau dashboard monitoring
  • Kenalan dengan format log dan metrik dasar

Audience

  • Tim operasi yang bertanggung jawab atas infrastruktur dan aplikasi
  • Site Reliability Engineers (SREs)
  • Tim monitoring dan observabilitas IT
 14 Jam

Jumlah Peserta


Harga per Peserta

Kursus Mendatang

Kategori Terkait