Terima kasih telah mengirimkan pertanyaan Anda! Salah satu anggota tim kami akan segera menghubungi Anda.
Terima kasih telah mengirimkan pemesanan Anda! Salah satu anggota tim kami akan segera menghubungi Anda.
Kerangka Materi
Pengenalan ke AIOps
- Apa itu AIOps dan mengapa penting
- Monitoring tradisional vs. observabilitas berbasis AIOps
- Arsitektur AIOps dan komponen utama
Pengumpulan dan Normalisasi Data Operasional
- Jenis data observabilitas: metrik, log, dan jejak
- Memasukkan data dari sumber yang berbeda (server, kontainer, cloud)
- Menggunakan agen dan ekspor (Prometheus, Beats, Fluentd)
Korelasi Data dan Deteksi Anomali
- Korelasi serangkaian waktu dan metode statistik
- Menggunakan model ML untuk deteksi anomali
- Mendeteksi insiden di sistem terdistribusi
Pengingat dan Pengurangan Kebisingan
- Merancang aturan pengingat cerdas dan ambang batas
- Penekanan, deduplikasi, dan kelompok pengingat
- Integrasi dengan Alertmanager, Slack, PagerDuty, atau Opsgenie
Analisis Penyebab Akar dan Visualisasi
- Menggunakan dashboard untuk memvisualisasikan metrik dan mendeteksi tren
- Menelusuri peristiwa dan timeline untuk analisis penyebab akar
- Melacak masalah di berbagai lapisan dengan alat tracing terdistribusi
Otomatisasi dan Perbaikan
- Memicu skrip atau workflow otomatis dari insiden
- Integrasi dengan sistem ITSM (ServiceNow, Jira)
- Kasus penggunaan: penyembuhan sendiri, penskalaan, pengeleman lalu lintas
Platform AIOps Open Source dan Komersial
- Gambaran umum alat: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Kriteria evaluasi untuk memilih platform AIOps
- Demo dan praktik langsung dengan tumpukan yang dipilih
Ringkasan dan Langkah Selanjutnya
Persyaratan
- Memahami konsep operasi IT dan monitoring sistem
- Pengalaman dengan alat atau dashboard monitoring
- Kenalan dengan format log dan metrik dasar
Audience
- Tim operasi yang bertanggung jawab atas infrastruktur dan aplikasi
- Site Reliability Engineers (SREs)
- Tim monitoring dan observabilitas IT
14 Jam