Kerangka Materi

Bab 1: Manajemen Data di HDFS

  • Bermacam Format Data (JSON / Avro / Parquet)
  • Skema Kompresi
  • Penyembunyian Data
  • Lab : menganalisis format data yang berbeda; mengaktifkan kompresi

Bab 2: Pig Lanjutan

  • Fungsi yang Didefinisikan Pengguna
  • Perkenalan ke Perpustakaan Pig (ElephantBird / Data-Fu)
  • Muat Data Struktur Kompleks menggunakan Pig
  • Pengaturan Pig
  • Lab : penulisan skrip pig lanjutan, mem-parsing tipe data kompleks

Bab 3: Hive Lanjutan

  • Fungsi yang Didefinisikan Pengguna
  • Tabel Kompresi
  • Pengaturan Performa Hive
  • Lab : membuat tabel terkompresi, mengevaluasi format dan konfigurasi tabel

Bab 4: HBase Lanjutan

  • Pemodelan Skema Lanjutan
  • Kompresi
  • Ingest Data Massal
  • Perbandingan Tabel Lebar / Tabel Tinggi
  • HBase dan Pig
  • HBase dan Hive
  • Pengaturan Performa HBase
  • Lab : pengaturan HBase; mengakses data HBase dari Pig & Hive; Menggunakan Phoenix untuk pemodelan data

Persyaratan

  • merasa nyaman dengan bahasa pemrograman Java (sebagian besar latihan pemrograman dalam java)
  • merasa nyaman di lingkungan Linux (dapat menavigasi baris perintah Linux, mengedit file menggunakan vi / nano)
  • pengetahuan dasar tentang Hadoop.

Lingkungan Lab

Instalasi Nol: Tidak perlu menginstal perangkat lunak hadoop pada komputer siswa! Klaster Hadoop yang berfungsi akan disediakan untuk siswa.

Siswa memerlukan hal-hal berikut

 21 Jam

Jumlah Peserta


Biaya per Peserta

Testimoni (5)

Kursus Mendatang

Kategori Terkait