Terima kasih telah mengirimkan pertanyaan Anda! Salah satu anggota tim kami akan segera menghubungi Anda.
Terima kasih telah mengirimkan pemesanan Anda! Salah satu anggota tim kami akan segera menghubungi Anda.
Kerangka Materi
Pengenalan ke AIOps
- Apa itu AIOps dan mengapa penting
- Monitoring tradisional vs. observabilitas yang didorong oleh AIOps
- Arsitektur dan komponen kunci dari AIOps
Mengumpulkan dan Normalisasi Data Operasional
- Jenis data observabilitas: metrik, log, dan jejak
- Menerima data dari berbagai sumber (server, kontainer, cloud)
- Menggunakan agen dan eksporter (Prometheus, Beats, Fluentd)
Korelasi Data dan Deteksi Anomali
- Korelasi seri waktu dan metode statistik
- Menggunakan model ML untuk deteksi anomali
- Mendeteksi insiden di sistem terdistribusi
Pemberitahuan dan Pengurangan Noise
- Merancang aturan pemberitahuan cerdas dan ambang batas
- Supresi, deduplikasi, dan pengelompokan pemberitahuan
- Integrasi dengan Alertmanager, Slack, PagerDuty, atau Opsgenie
Analisis Penyebab Utama dan Visualisasi
- Menggunakan dashboard untuk visualisasi metrik dan deteksi tren
- Meneliti acara dan garis waktu untuk RCA
- Melacak masalah lintas lapisan dengan alat pelacakan terdistribusi
Otonomasi dan Perbaikan
- Memicu skrip atau alur kerja otomatis dari insiden
- Integrasi dengan sistem ITSM (ServiceNow, Jira)
- Kasus penggunaan: penyembuhan diri, penyesuaian kapasitas, rute ulang lalu lintas
Platform Open Source dan Komersial untuk AIOps
- Tinjauan alat: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Kriteria evaluasi untuk memilih platform AIOps
- Demo dan praktek dengan stack yang dipilih
Ringkasan dan Langkah Berikutnya
Persyaratan
- Pemahaman tentang operasi IT dan konsep pemantauan sistem
- Pengalaman dengan alat atau dashboard pemantauan
- Ketahui format log dan metrik dasar
Audience
- Tim operasi yang bertanggung jawab atas infrastruktur dan aplikasi
- Site Reliability Engineers (SRE)
- Tim pemantauan IT dan observabilitas
14 Jam