Kerangka Materi

Sesi 1: Data Management dalam HDFS

  • Berbagai Format Data (JSON / Avro / Parquet)
  • Sistem Kompresi
  • Pemblokiran Data
  • Laboratorium : Menganalisis berbagai format data; mengaktifkan kompresi

Sesi 2: Pig Lanjutan

  • Fungsi yang Didefinisikan Pengguna
  • Pendahuluan tentang Perpustakaan Pig (ElephantBird / Data-Fu)
  • Mengisi Data Struktur Kompleks menggunakan Pig
  • Tuning Pig
  • Laboratorium : menulis skrip Pig lanjutan, memproses tipe data kompleks

Sesi 3: Lanjutan Hive

  • Fungsi yang Didefinisikan Pengguna
  • Tabel Terkompresi
  • Pengoptimalan Performa Hive
  • Laboratorium : membuat tabel terkompresi, mengevaluasi format dan konfigurasi tabel

Sesi 4: Lanjutan HBase

  • Pemodelan Skema Lanjutan
  • Kompresi
  • Penyisipan Data Massal
  • Perbandingan Tabel Lebar / Tabel Tinggi
  • HBase dan Pig
  • HBase dan Hive
  • Pengoptimalan Performa HBase
  • Laboratorium : menyetel HBase; mengakses data HBase dari Pig & Hive; Menggunakan Phoenix untuk pemodelan data

Persyaratan

  • nyaman dengan bahasa pemrograman Java (banyak latihan pemrograman dalam java)
  • nyaman dalam lingkungan Linux (dapat menavigasi baris perintah Linux, mengedit file menggunakan vi / nano)
  • pemahaman kerja tentang Hadoop.

Lingkungan Lab

Zero Install: Tidak perlu menginstall perangkat lunak hadoop pada mesin mahasiswa! Sebuah kluster hadoop yang berfungsi akan disediakan untuk mahasiswa.

Mahasiswa memerlukan berikut

 21 Jam

Jumlah Peserta


Biaya per Peserta

Testimoni (5)

Kursus Mendatang

Kategori Terkait