Terima kasih telah mengirimkan pertanyaan Anda! Salah satu anggota tim kami akan segera menghubungi Anda.
Terima kasih telah mengirimkan pemesanan Anda! Salah satu anggota tim kami akan segera menghubungi Anda.
Kerangka Materi
Pengantar:
- Apache Spark di Ecosistem Hadoop
- Pengantar singkat untuk Python, Scala
Dasar-dasar (teori):
- Arsitektur
- RDD
- Transformasi dan Aksi
- Tahap, tugas, dan ketergantungan
Memahami dasar-dasar dengan menggunakan lingkungan Databricks (workshop praktis):
- Latihan menggunakan RDD API
- Fungsi aksi dan transformasi dasar
- PairRDD
- Gabungan
- Strategi pencatatan
- Latihan menggunakan DataFrame API
- SparkSQL
- DataFrame: pilih, filter, kelompokkan, urutkan
- UDF (Fungsi Tertentu Pengguna)
- Menelusuri DataSet API
- Aliran
Memahami penempatan dengan menggunakan lingkungan AWS (workshop praktis):
- Dasar-dasar AWS Glue
- Memahami perbedaan antara AWS EMR dan AWS Glue
- Contoh tugas di kedua lingkungan
- Memahami kelebihan dan kekurangan
Tambahan:
- Pengantar penjadwalan Apache Airflow
Persyaratan
Kemampuan pemrograman (dengan preferensi python, scala)Dasar SQL
21 Jam
Testimoni (3)
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Kursus - Apache Spark in the Cloud
1. Right balance between high level concepts and technical details. 2. Andras is very knowledgeable about his teaching. 3. Exercise
Steven Wu - Intelligent Medical Objects
Kursus - Apache Spark in the Cloud
Get to learn spark streaming , databricks and aws redshift