Kerangka Materi

Pengantar ke Platform Stratio

  • Ringkasan arsitektur dan modul inti Stratio
  • Peran Rocket dan Intelligence dalam siklus hidup data
  • Masuk dan menjelajahi antarmuka pengguna (UI) Stratio

Bekerja dengan Modul Rocket

  • Pemrosesan data masuk dan pembuatan pipa
  • Menghubungkan sumber data dan mengonfigurasi transformasi
  • Menggunakan PySpark untuk tugas pra-pemrosesan di Rocket

PySpark Essensial bagi Pengguna Stratio

  • Struktur data dan operasi PySpark
  • Konstruksi looping: penggunaan for, while, if/else
  • Menulis fungsi kustom dengan def dan menerapkannya

Penggunaan Lanjutan Rocket dengan PySpark

  • Pemrosesan data masuk streaming dan transformasi
  • Menggunakan looping dan fungsi dalam skenario batch dan real-time
  • Praktik terbaik untuk kinerja di pipa PySpark

Menjelajahi Modul Intelligence

  • Ringkasan fitur pemodelan dan analisis data
  • Pemilihan fitur, transformasi, dan eksplorasi
  • Peran PySpark dalam analitik kustom dan insight

Membangun Alur Kerja Analitik Lanjutan

  • Membuat fungsi terdefinisi pengguna (UDFs) di Intelligence
  • Mengaplikasikan kondisional dan looping untuk logika data
  • Kasus penggunaan: segmentasi, agregasi, dan prediksi

Penyebaran dan Collaboration

  • Menyimpan, mengekspor, dan mengulang alur kerja
  • Berkolaborasi dengan anggota tim lainnya di Stratio
  • Memeriksa output dan mengintegrasikan dengan alat turunan

Ringkasan dan Langkah Berikutnya

Persyaratan

  • Pengalaman dalam pemrograman Python
  • Pengertian tentang konsep analisis data atau pemrosesan data besar
  • Pengetahuan dasar tentang Apache Spark dan komputasi terdistribusi

Penonton

  • Data engineers yang bekerja pada platform Stratio
  • Analis atau pengembang yang menggunakan modul Rocket dan Intelligence
  • Tim teknis yang melakukan transisi ke workflow PySpark dalam Stratio
 14 Jam

Jumlah Peserta


Biaya per Peserta

Testimoni (3)

Kursus Mendatang

Kategori Terkait