Kerangka Materi

Big Data Overview:

  • Apa itu Big Data
  • Mengapa Big Data semakin populer
  • Studi Kasus Big Data
  • Karakteristik Big Data
  • Solusi untuk bekerja dengan Big Data.

Hadoop & Komponennya:

  • Apa itu Hadoop dan apa komponen-komponennya.
  • Arsitektur Hadoop dan karakteristik data yang dapat diolah/diproses olehnya.
  • Ringkasan sejarah Hadoop, perusahaan yang menggunakannya, dan alasan mereka mulai menggunakan teknologi ini.
  • Kerangka kerja Hadoop & komponen-komponennya - dijelaskan secara detail.
  • Apa itu HDFS dan operasi Read-Write pada Sistem File Distribusi Hadoop.
  • Cara mengatur klaster Hadoop dalam berbagai mode - Stand-alone/Pseudo/Multi Node cluster.

(Ini termasuk mengatur klaster Hadoop di VirtualBox/KVM/VMware, konfigurasi jaringan yang harus diperiksa dengan hati-hati, menjalankan Daemon Hadoop dan menguji klaster).

  • Apa itu Kerangka Kerja Map Reduce dan bagaimana cara kerjanya.
  • Menjalankan pekerjaan Map Reduce di klaster Hadoop.
  • Memahami Replikasi, Mirroring, dan Kesadaran Rack dalam konteks klaster Hadoop.

Perencanaan Klaster Hadoop:

  • Bagaimana merencanakan klaster hadoop Anda.
  • Memahami perangkat keras-perangkat lunak untuk merencanakan klaster hadoop Anda.
  • Memahami beban kerja dan merencanakan klaster untuk menghindari kegagalan dan optimalisasi kinerja.

Apa itu MapR dan Mengapa MapR :

  • Ringkasan tentang MapR dan arsitektur-nya.
  • Memahami & bekerja dengan Sistem Kontrol MapR, Volume MapR, snapshot & Mirrors.
  • Merencanakan klaster dalam konteks MapR.
  • Perbandingan antara MapR dengan distribusi lainnya dan Apache Hadoop.
  • Instalasi dan penyebaran klaster MapR.

Penyetelan & Administrasi Klaster:

  • Mengelola layanan, node, snapshot, volume cermin, dan klaster jarak jauh.
  • Memahami dan mengelola Node.
  • Memahami komponen Hadoop, menginstal komponen Hadoop bersama dengan layanan MapR.
  • Mengelola data di klaster termasuk melalui NFS, pengelolaan layanan & node.
  • Pengelolaan data menggunakan volume, mengelola pengguna dan grup, mengelola & menugaskan peran ke nodes, komisi dan dekomisi nodes, administrasi klaster dan pemantauan kinerja, konfigurasi/analisis dan pemantauan metrik untuk memantau kinerja, konfigurasi dan pengadministrasian keamanan MapR.
  • Memahami dan bekerja dengan M7 - penyimpanan asli untuk tabel MapR.
  • Konfigurasi dan penyetelan klaster untuk kinerja optimal.

Peningkatan Klaster dan Integrasi Dengan Setup Lainnya:

  • Memperbarui versi perangkat lunak MapR dan jenis peningkatan.
  • Mengonfigurasi klaster Mapr untuk mengakses klaster HDFS.
  • Menyiapkan klaster MapR di Amazon Elastic Mapreduce.

Semua topik di atas termasuk demonstrasi dan sesi praktik untuk memberikan pengalaman hands-on bagi peserta kursus.

Persyaratan

  • Pengetahuan dasar tentang Linux FS
  • Pengetahuan dasar Java
  • Pengetahuan tentang Administrasi Apache Hadoop (disarankan)
 28 Jam

Jumlah Peserta


Biaya per Peserta

Testimoni (1)

Kursus Mendatang

Kategori Terkait