Kerangka Materi

Pendahuluan tentang Google Colab dan Apache Spark

  • Ringkasan tentang Google Colab
  • Pendahuluan tentang Apache Spark
  • Mengatur Spark di Google Colab

Pengolahan Data dengan Apache Spark

  • Bekerja dengan RDDs dan DataFrames
  • Memuat dan memproses dataset yang besar
  • Menggunakan Spark SQL untuk mengquery data terstruktur

Analitik Lanjutan dengan Spark

  • Machine learning dengan Spark MLlib
  • Melakukan analisis data real-time
  • Komputasi terdistribusi dengan Spark

Visualisasi dan Collaboration di Google Colab

  • Mengintegrasikan Colab dengan perpustakaan visualisasi populer
  • Kolaborasi kerja dengan notebook Colab
  • Berbagi dan mengekspor hasil

Optimalisasi Workflows Big Data

  • Menyesuaikan Spark untuk kinerja
  • Mengoptimalkan penggunaan memori dan penyimpanan
  • Skalabilitas workflow untuk dataset yang besar

Big Data di Cloud

  • Mengintegrasikan Google Colab dengan alat berbasis cloud
  • Menggunakan penyimpanan cloud untuk big data
  • Bekerja dengan Spark di lingkungan cloud terdistribusi

Studi Kasus dan Best Practices

  • Tinjauan aplikasi big data dunia nyata
  • Studi kasus menggunakan Apache Spark dan Colab
  • Best practices untuk analitik big data

Ringkasan dan Langkah Selanjutnya

Persyaratan

  • Pengetahuan dasar tentang konsep ilmu data
  • Kesederhanaan dengan Apache Spark
  • Keterampilan pemrograman Python

Audiens

  • Ilmuwan data
  • Insinyur data
  • Peneliti yang bekerja dengan big data
 14 Jam

Jumlah Peserta


Biaya per Peserta

Testimoni (5)

Kursus Mendatang

Kategori Terkait