Kerangka Materi

Pendahuluan Ekosistem Big Data

  • Tinjauan teknologi dan arsitektur big data
  • Pengolahan batch vs. pengolahan real-time
  • Strategi penyimpanan data untuk skalabilitas

Pengolahan Data Lanjut dengan Apache Spark

  • Meningkatkan kinerja pekerjaan Spark
  • Transformasi dan aksi lanjut
  • Bekerja dengan structured streaming

Machine Learning di Skala Besar

  • Teknik pelatihan model terdistribusi
  • Tuning hiperparameter pada dataset besar
  • Deploy model di lingkungan big data

Deep Learning untuk Big Data

  • Integrasi TensorFlow dan PyTorch dengan Spark
  • Pipa pelatihan deep learning terdistribusi
  • Kasus penggunaan dalam analisis gambar, teks, dan deret waktu

Analitik Real-Time dan Data Streaming

  • Apache Kafka untuk pengambilan data streaming
  • Kerangka kerja pengolahan streaming
  • Monitoring dan alert dalam sistem real-time

Data Governance, Keamanan, dan Etika

  • Persyaratan privasi data dan keterangan
  • Kontrol dan enkripsi Access dalam sistem big data
  • Konsiderasi etis dalam analitik skala besar

Mengintegrasikan Big Data dengan Business Intelligence

  • Visualisasi data dan dashboarding untuk big data
  • Menyambungkan pipeline big data ke alat BI
  • Mendorong hasil bisnis dengan analitik lanjut

Ringkasan dan Langkah Selanjutnya

Persyaratan

  • Memiliki pemahaman yang kuat tentang konsep analisis data dan pemodelan statistik
  • Pengalaman dengan alat pengolahan data dan bahasa pemrograman seperti Python, R, atau Scala
  • Kenalan dengan kerangka kerja komputasi terdistribusi seperti Hadoop atau Spark

Audience

  • Ilmuwan data yang ingin memahami pengolahan data besar dan analitik prediktif
  • Analis senior yang ingin merancang dan mengimplementasikan workflow analitik tingkat lanjut
  • Profesional R&D yang berfokus pada solusi berbasis data inovatif
 42 Jam

Jumlah Peserta


Biaya per Peserta

Testimoni (5)

Kursus Mendatang

Kategori Terkait