Kerangka Materi

Pengantar ke Platform Stratio

  • Ringkasan arsitektur dan modul inti Stratio
  • Peran Rocket dan Intelligence dalam siklus hidup data
  • Masuk dan menjelajahi antarmuka pengguna (UI) Stratio

Bekerja dengan Modul Rocket

  • Pemrosesan data masuk dan pembuatan pipa
  • Menghubungkan sumber data dan mengonfigurasi transformasi
  • Menggunakan PySpark untuk tugas pra-pemrosesan di Rocket

PySpark Essensial bagi Pengguna Stratio

  • Struktur data dan operasi PySpark
  • Konstruksi looping: penggunaan for, while, if/else
  • Menulis fungsi kustom dengan def dan menerapkannya

Penggunaan Lanjutan Rocket dengan PySpark

  • Pemrosesan data masuk streaming dan transformasi
  • Menggunakan looping dan fungsi dalam skenario batch dan real-time
  • Praktik terbaik untuk kinerja di pipa PySpark

Menjelajahi Modul Intelligence

  • Ringkasan fitur pemodelan dan analisis data
  • Pemilihan fitur, transformasi, dan eksplorasi
  • Peran PySpark dalam analitik kustom dan insight

Membangun Alur Kerja Analitik Lanjutan

  • Membuat fungsi terdefinisi pengguna (UDFs) di Intelligence
  • Mengaplikasikan kondisional dan looping untuk logika data
  • Kasus penggunaan: segmentasi, agregasi, dan prediksi

Penyebaran dan Collaboration

  • Menyimpan, mengekspor, dan mengulang alur kerja
  • Berkolaborasi dengan anggota tim lainnya di Stratio
  • Memeriksa output dan mengintegrasikan dengan alat turunan

Ringkasan dan Langkah Berikutnya

Persyaratan

  • Pengalaman dengan pemrograman Python
  • Memahami konsep analitik data atau pengolahan big data
  • Pengetahuan dasar tentang Apache Spark dan komputasi terdistribusi

Audience

  • Data engineers yang bekerja pada platform berbasis Stratio
  • Analitik atau pengembang yang menggunakan modul Rocket dan Intelligence
  • Tim teknis yang beralih ke alur kerja PySpark dalam Stratio

Stratio: Modul Rocket dan Intelligence dengan PySpark

Pengenalan Platform Stratio

  • Gambaran umum arsitektur Stratio dan modul inti
  • Peran Rocket dan Intelligence dalam siklus hidup data
  • Masuk dan navigasi antarmuka pengguna (UI) Stratio

Bekerja dengan Modul Rocket

  • Pengambilan data dan pembuatan pipa
  • Menghubungkan sumber data dan mengonfigurasi transformasi
  • Menggunakan PySpark untuk tugas pra-pemrosesan dalam Rocket

Esensial PySpark bagi Pengguna Stratio

  • Struktur data dan operasi PySpark
  • Konstruksi looping: penggunaan for, while, if/else
  • Menulis fungsi kustom dengan def dan mengaplikasikannya

Penggunaan Lanjutan Rocket dengan PySpark

  • Pengambilan data real-time dan transformasi
  • Menggunakan loop dan fungsi dalam skenario batch dan waktu nyata
  • Praktik terbaik untuk kinerja pipa PySpark

Menjelajahi Modul Intelligence

  • Gambaran umum fitur pemodelan data dan analisis
  • Pemilihan fitur, transformasi, dan eksplorasi
  • Peran PySpark dalam analitik kustom dan wawasan

Membangun Alur Kerja Analitik Lanjutan

  • Membuat fungsi pengguna yang didefinisikan (UDFs) di Intelligence
  • Mengaplikasikan kondisional dan loop untuk logika data
  • Contoh kasus: segmentasi, agregasi, dan prediksi

Penerapan dan Collaboration

  • Menyimpan, mengekspor, dan mengulang alur kerja
  • Berkolaborasi dengan anggota tim lainnya di Stratio
  • Memeriksa output dan mengintegrasikan dengan alat turunan

Ringkasan dan Langkah Selanjutnya

Stratio adalah platform yang berfokus pada data yang mengintegrasikan big data, AI, dan pengelolaan menjadi solusi tunggal. Modul Rocket dan Intelligence-nya memungkinkan pengeksplorasian, transformasi, dan analitik lanjutan data dengan cepat dalam lingkungan enterprise.

Pelatihan daring atau di tempat ini, yang dipandu oleh instruktur, ditujukan untuk profesional data level menengah yang ingin menggunakan modul Rocket dan Intelligence di Stratio secara efektif dengan PySpark, fokus pada struktur loop, fungsi pengguna yang didefinisikan, dan logika data lanjutan.

Dengan mengikuti pelatihan ini, peserta akan dapat:

  • Navigasi dan bekerja di dalam platform Stratio menggunakan modul Rocket dan Intelligence.
  • Menerapkan PySpark dalam konteks pengambilan data, transformasi, dan analisis.
  • Menggunakan loop dan logika kondisional untuk mengontrol alur kerja data dan tugas engineering fitur.
  • Membuat dan memanajemen fungsi pengguna yang didefinisikan (UDFs) untuk operasi data berulang di PySpark.

Format Kursus

  • Lecture interaktif dan diskusi.
  • Banyak latihan dan praktik.
  • Implementasi langsung dalam lingkungan lab langsung.

Opsi Personalisasi Kursus

  • Untuk meminta pelatihan yang disesuaikan untuk kursus ini, silakan hubungi kami untuk mengatur.

Experience with Python programming

Understanding of data analytics or big data processing concepts

Basic knowledge of Apache Spark and distributed computing

Audience

  • Data engineers working on Stratio-based platforms
  • Analysts or developers using Rocket and Intelligence modules
  • Technical teams transitioning to PySpark workflows within Stratio
 14 Jam

Jumlah Peserta


Biaya per Peserta

Testimoni (5)

Kursus Mendatang

Kategori Terkait