Kerangka Materi

  1. Pendahuluan Scala

    • Pendahuluan singkat tentang Scala
    • Labs: Memahami Scala
  2. Dasar Spark

    • Latar belakang dan sejarah
    • Spark dan Hadoop
    • Konsep dan arsitektur Spark
    • Ekosistem Spark (core, spark sql, mlib, streaming)
    • Labs: Memasang dan menjalankan Spark
  3. Pertama Kali Melihat Spark

    • Menjalankan Spark dalam mode lokal
    • Antarmuka web Spark
    • Shell Spark
    • Menganalisis dataset – bagian 1
    • Memeriksa RDDs
    • Labs: Penjelajahan shell Spark
  4. RDDs

    • Konsep RDDs
    • Partisi
    • Operasi / transformasi RDD
    • Tipe RDD
    • RDD pasangan kunci-nilai
    • MapReduce di RDD
    • Penyimpanan dalam memori dan keberlanjutan
    • Labs: Membuat dan memeriksa RDDs; Memperdalam RDDs
  5. Pengembangan API Spark

    • Pendahuluan tentang API Spark / API RDD
    • Mengirim program pertama ke Spark
    • Pembacaan kesalahan / pengaturan log
    • Properti konfigurasi
    • Labs: Pengembangan di API Spark, Mengirim tugas
  6. Spark SQL

    • Dukungan SQL di Spark
    • Dataframes
    • Mendefinisikan tabel dan mengimpor dataset
    • Menelusuri dataframes dengan SQL
    • Format penyimpanan: JSON / Parquet
    • Labs: Membuat dan menelusuri dataframes; Menevaluasi format data
  7. MLlib

    • Pendahuluan MLib
    • Algoritma MLib
    • Labs: Menulis aplikasi MLib
  8. GraphX

    • Tinjauan pustaka GraphX
    • API GraphX
    • Labs: Memproses data grafis dengan Spark
  9. Spark Streaming

    • Tinjauan streaming
    • Menevaluasi platform streaming
    • Operasi streaming
    • Operasi jendela geser
    • Labs: Menulis aplikasi streaming Spark
  10. Spark dan Hadoop

    • Pendahuluan Hadoop (HDFS / YARN)
    • Arsitektur Hadoop + Spark
    • Menjalankan Spark di Hadoop YARN
    • Memproses file HDFS dengan Spark
  11. Kinerja dan Penyesuaian Spark

    • Variabel siaran
    • Akumulator
    • Pengelolaan memori dan penyimpanan dalam memori
  12. Operasi Spark

    • Menyebarkan Spark dalam produksi
    • Contoh templat penyebaran
    • Konfigurasi
    • Pengawasan
    • Penyelesaian masalah

Persyaratan

PRASYARAT


Penyelesaian dengan salah satu bahasa Java / Scala / Python (lab kita dalam Scala dan Python)
Pengertian dasar lingkungan pengembangan Linux (navigasi baris perintah / mengedit file menggunakan VI atau nano)


 21 Jam

Jumlah Peserta


Biaya per Peserta

Testimoni (6)

Kursus Mendatang

Kategori Terkait