Kerangka Materi

Hari 1: Pengolahan Data dan Esensi Python

Sesi 1: Spark DataFrames dan Operasi Dasar

  • Bekerja dengan Spark DataFrames Melakukan Operasi Dasar
  • Operasi Groupby dan Aggregate
  • Menangani Timestamps dan Tanggal
  • Latihan Hands-on: Analisis data menggunakan Spark DataFrames

Sesi 2: Pemrograman Python untuk Big Data

  • Python Inti untuk Pengolahan Data Menggunakan Variabel, Daftar, dan Fungsi
  • Bekerja dengan Kelas dan Berkas
  • Mengintegrasikan API dan Data Eksternal
  • Latihan Hands-on: Membangun proyek Python yang memproses dan menganalisis data dengan PySpark

Hari 2: PySpark Lanjutan dan Pembelajaran Mesin

Sesi 3: Pembelajaran Mesin dengan PySpark

  • Melakukan Pembelajaran Mesin dengan Spark MLlib Regresi Linier dan Logistik
  • Model Klasifikasi Random Forest
  • Latihan Hands-on: Membangun dan mengevaluasi model pembelajaran mesin menggunakan PySpark

Sesi 4: Klustering dan Sistem Rekomendasi

  • Teori dan Implementasi Praktis Klustering K-means
  • Latihan Hands-on: Membangun model klustering K-means
  • Sistem Rekomendasi Membangun mesin rekomendasi dengan Spark MLlib
  • Latihan Hands-on: Proyek sistem rekomendasi

Sesi 5: Spark Streaming dan NLP

  • Streaming Data Real-Time dengan Spark Melakukan pengolahan data real-time
  • Latihan Hands-on: Streaming data dengan Spark
  • Pemrosesan Bahasa Alami (NLP) dengan PySpark Melakukan tugas NLP dasar
  • Latihan Hands-on: Pipelines NLP menggunakan PySpark
 14 Jam

Jumlah Peserta


Biaya per Peserta

Testimoni (1)

Kursus Mendatang

Kategori Terkait