Kerangka Materi
Bab 1: Manajemen Data di HDFS
- Bermacam Format Data (JSON / Avro / Parquet)
- Skema Kompresi
- Penyembunyian Data
- Lab : menganalisis format data yang berbeda; mengaktifkan kompresi
Bab 2: Pig Lanjutan
- Fungsi yang Didefinisikan Pengguna
- Perkenalan ke Perpustakaan Pig (ElephantBird / Data-Fu)
- Muat Data Struktur Kompleks menggunakan Pig
- Pengaturan Pig
- Lab : penulisan skrip pig lanjutan, mem-parsing tipe data kompleks
Bab 3: Hive Lanjutan
- Fungsi yang Didefinisikan Pengguna
- Tabel Kompresi
- Pengaturan Performa Hive
- Lab : membuat tabel terkompresi, mengevaluasi format dan konfigurasi tabel
Bab 4: HBase Lanjutan
- Pemodelan Skema Lanjutan
- Kompresi
- Ingest Data Massal
- Perbandingan Tabel Lebar / Tabel Tinggi
- HBase dan Pig
- HBase dan Hive
- Pengaturan Performa HBase
- Lab : pengaturan HBase; mengakses data HBase dari Pig & Hive; Menggunakan Phoenix untuk pemodelan data
Persyaratan
- merasa nyaman dengan bahasa pemrograman Java (sebagian besar latihan pemrograman dalam java)
- merasa nyaman di lingkungan Linux (dapat menavigasi baris perintah Linux, mengedit file menggunakan vi / nano)
- pengetahuan dasar tentang Hadoop.
Lingkungan Lab
Instalasi Nol: Tidak perlu menginstal perangkat lunak hadoop pada komputer siswa! Klaster Hadoop yang berfungsi akan disediakan untuk siswa.
Siswa memerlukan hal-hal berikut
Testimoni (5)
Contoh-contoh langsung
Ahmet Bolat - Accenture Industrial SS
Kursus - Python, Spark, and Hadoop for Big Data
Diterjemahkan Mesin
Selama latihan, James menjelaskan kepada saya setiap langkah dengan lebih detail kapan pun saya tersendat. Saya benar-benar baru mengenal NIFI. Dia menjelaskan tujuan sebenarnya dari NIFI, bahkan dasar-dasar seperti open source. Dia menutupi setiap konsep Nifi mulai dari Tingkat Pemula hingga Tingkat Pengembang.
Firdous Hashim Ali - MOD A BLOCK
Kursus - Apache NiFi for Administrators
Diterjemahkan Mesin
Bahwa saya memiliki itu sejak awal.
Peter Scales - CACI Ltd
Kursus - Apache NiFi for Developers
Diterjemahkan Mesin
hal-hal praktis yang dilakukan, serta teori juga disampaikan dengan baik oleh Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kursus - Hadoop Administration on MapR
Diterjemahkan Mesin
VM yang saya sukai sangat Instruktur sangat berpengetahuan tentang topik tersebut serta topik lainnya, dia sangat baik dan ramah Saya suka fasilitas di Dubai.
Safar Alqahtani - Elm Information Security
Kursus - Big Data Analytics in Health
Diterjemahkan Mesin