Course Outline
Bagian 1: Data Management di HDFS
- Berbagai Format Data (JSON / Avro / Parquet)
- Skema Kompresi
- Penyamaran Data
- Lab: Menganalisis berbagai format data; mengaktifkan kompresi
Bagian 2: Babi Lanjutan
- Fungsi yang ditentukan pengguna
- Pengantar Perpustakaan Babi (ElephantBird / Data-Fu)
- Memuat Data Terstruktur Kompleks menggunakan Pig
- Penyetelan Babi
- Lab: skrip pig tingkat lanjut, parsing tipe data kompleks
Bagian 3 : Lanjutan Hive
- Fungsi yang ditentukan pengguna
- Tabel Terkompresi
- Hive Penyetelan Performa
- Lab: membuat tabel terkompresi, mengevaluasi format tabel dan konfigurasi
Bagian 4: HBase Lanjutan
- Pemodelan Skema Tingkat Lanjut
- Kompresi
- Pengambilan Data Massal
- Perbandingan meja lebar / meja tinggi
- HBase dan Pig
- HBase dan Hive
- Penyetelan Performa HBase
- Lab: penyetelan HBase; mengakses data HBase dari Pig & Hive; Menggunakan Phoenix untuk pemodelan data
Requirements
- nyaman dengan bahasa pemrograman Java (sebagian besar latihan pemrograman menggunakan java)
- nyaman di lingkungan Linux (dapat menavigasi baris perintah Linux, mengedit file menggunakan vi / nano)
- pengetahuan kerja tentang Hadoop.
Lingkungan laboratorium
Zero Install: Tidak perlu menginstal perangkat lunak hadoop di komputer siswa! Kluster hadoop yang berfungsi akan disediakan untuk siswa.
Siswa akan membutuhkan hal-hal berikut ini
- klien SSH (Linux dan Mac sudah memiliki klien ssh, untuk Windows Putty direkomendasikan)
- browser untuk mengakses cluster. Kami merekomendasikan browser Firefox
Testimonials (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Course - Python, Spark, and Hadoop for Big Data
During the exercises, James explained me every step whereever I was getting stuck in more detail. I was completely new to NIFI. He explained the actual purpose of NIFI, even the basics such as open source. He covered every concept of Nifi starting from Beginner Level to Developer Level.
Firdous Hashim Ali - MOD A BLOCK
Course - Apache NiFi for Administrators
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Course - Impala for Business Intelligence
That I had it in the first place.
Peter Scales - CACI Ltd
Course - Apache NiFi for Developers
practical things of doing, also theory was served good by Ajay