Kerangka Materi

Pengenalan ke AIOps

  • Apa itu AIOps dan mengapa penting
  • Monitoring tradisional vs. observabilitas yang didorong oleh AIOps
  • Arsitektur dan komponen kunci dari AIOps

Mengumpulkan dan Normalisasi Data Operasional

  • Jenis data observabilitas: metrik, log, dan jejak
  • Menerima data dari berbagai sumber (server, kontainer, cloud)
  • Menggunakan agen dan eksporter (Prometheus, Beats, Fluentd)

Korelasi Data dan Deteksi Anomali

  • Korelasi seri waktu dan metode statistik
  • Menggunakan model ML untuk deteksi anomali
  • Mendeteksi insiden di sistem terdistribusi

Pemberitahuan dan Pengurangan Noise

  • Merancang aturan pemberitahuan cerdas dan ambang batas
  • Supresi, deduplikasi, dan pengelompokan pemberitahuan
  • Integrasi dengan Alertmanager, Slack, PagerDuty, atau Opsgenie

Analisis Penyebab Utama dan Visualisasi

  • Menggunakan dashboard untuk visualisasi metrik dan deteksi tren
  • Meneliti acara dan garis waktu untuk RCA
  • Melacak masalah lintas lapisan dengan alat pelacakan terdistribusi

Otonomasi dan Perbaikan

  • Memicu skrip atau alur kerja otomatis dari insiden
  • Integrasi dengan sistem ITSM (ServiceNow, Jira)
  • Kasus penggunaan: penyembuhan diri, penyesuaian kapasitas, rute ulang lalu lintas

Platform Open Source dan Komersial untuk AIOps

  • Tinjauan alat: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Kriteria evaluasi untuk memilih platform AIOps
  • Demo dan praktek dengan stack yang dipilih

Ringkasan dan Langkah Berikutnya

Persyaratan

  • Pemahaman tentang operasi IT dan konsep pemantauan sistem
  • Pengalaman dengan alat atau dashboard pemantauan
  • Ketahui format log dan metrik dasar

Audience

  • Tim operasi yang bertanggung jawab atas infrastruktur dan aplikasi
  • Site Reliability Engineers (SRE)
  • Tim pemantauan IT dan observabilitas
 14 Jam

Jumlah Peserta


Biaya per Peserta

Kursus Mendatang

Kategori Terkait