Course Outline
Pengantar
- Pengenalan solusi Cloud Computing dan Big Data
- Ringkasan Fitur dan Arsitektur Apache Hadoop
Menyiapkan Hadoop
- Perencanaan klaster Hadoop (on-premise, cloud, dll.)
- Pemilihan OS dan distribusi Hadoop
- Alokasi sumber daya (hardware, jaringan, dll.)
- Mendownload dan menginstal perangkat lunak
- Penentuan ukuran klaster untuk fleksibilitas
Bekerja dengan HDFS
- Mengerti Sistem File Terdistribusi Hadoop (HDFS)
- Ringkasan Referensi Perintah HDFS
- Accessing HDFS
- Melakukan Operasi Berkas Dasar di HDFS
- Menggunakan S3 sebagai tambahan untuk HDFS
Ringkasan dari MapReduce
- Mengerti Aliran Data dalam Framework MapReduce
- Map, Shuffle, Sort dan Reduce
- Demo: Menghitung Gaji Teratas
Bekerja dengan YARN
- Mengerti manajemen sumber daya di Hadoop
- Bekerja dengan ResourceManager, NodeManager, Application Master
- Jadwal pekerjaan di bawah YARN
- Jadwal untuk ribuan node dan klaster
- Demo: Jadwal pekerjaan
Mengintegrasikan Hadoop dengan Spark
- Menyiapkan penyimpanan untuk Spark (HDFS, Amazon, S3, NoSQL, dll.)
- Mengerti Resilient Distributed Datasets (RDDs)
- Membuat RDD
- Menerapkan Transformasi RDD
- Demo: Implementasi Program Pencarian Teks untuk Judul Film
Memelihara Klaster Hadoop
- Pemantauan Hadoop
- Mengamankan klaster Hadoop
- Menambah dan menghapus node
- Melakukan benchmark kinerja
- Tuning klaster Hadoop untuk mengoptimalkan performa
- Backup, pemulihan dan perencanaan kontinuitas bisnis
- Menjamin kehadiran tinggi (HA)
Peningkatan dan Migrasi Klaster Hadoop
- Evaluasi persyaratan beban kerja
- Meningkatkan Hadoop
- Beralih dari on-premise ke cloud dan sebaliknya
- Pemulihan dari kegagalan
Penyelidikan Gangguan
Kesimpulan dan Penutup
Requirements
- Pengalaman dalam administrasi sistem
- Pengalaman dengan baris perintah Linux
- Pemahaman tentang konsep big data
Audience
- Administrators sistem
- DBAs
Testimonials (5)
Banyak contoh praktis, cara berbeda untuk mendekati masalah yang sama, dan terkadang trik yang tidak begitu jelas untuk meningkatkan solusi saat ini
Rafal - Nordea
Course - Apache Spark MLlib
Machine Translated
Sufficient hands on, trainer is knowledgable
Chris Tan
Course - A Practical Introduction to Stream Processing
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Course - Impala for Business Intelligence
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Course - Apache Spark in the Cloud
practice tasks