Kerangka Materi
Pendahuluan Apache Spark
- Peran Spark dalam pengolahan data besar
- Arsitektur Spark dan komponennya
Mempersiapkan Apache Spark
- Persyaratan perangkat keras dan perangkat lunak
- Tahapan instalasi untuk mode berdiri sendiri dan kluster
- Terbaik praktik konfigurasi untuk administrator sistem
Mengelola Kluster Spark
- Alat dan teknik manajemen kluster
- Memantau aplikasi Spark dan sumber daya kluster
- Konfigurasi keamanan dan manajemen pengguna
Penyesuaian Kinerja dan Optimasi
- Alokasi sumber daya dan penjadwalan
- Menyesuaikan Spark untuk kinerja optimal
- Mengenali dan menyelesaikan masalah umpan
Penyelesaian Masalah dan Penyelesaian Masalah
- Tantangan administrasi Spark yang umum
- Alat dan teknik diagnostik untuk penyelesaian masalah
- Langkah demi langkah pendekatan untuk menyelesaikan masalah umum
- Terbaik praktik untuk memelihara lingkungan Spark yang sehat
Topik Administrasi Lanjut
- Integrasi dengan alat data besar lainnya
- Memastikan ketersediaan tinggi dan pemulihan bencana
- Memperbarui dan meningkatkan skalabilitas kluster Spark
Ringkasan dan Langkah Selanjutnya
Persyaratan
- Pengetahuan dasar tentang konfigurasi dan manajemen jaringan
- Kenalan dengan sistem operasi Linux dan antarmuka baris perintah
- Minat untuk belajar tentang sistem komputasi terdistribusi dan manajemen data besar
Target Peserta
- Administrator sistem
Testimoni (5)
Banyak contoh praktis, cara berbeda untuk mendekati masalah yang sama, dan terkadang trik yang tidak begitu jelas untuk meningkatkan solusi saat ini
Rafal - Nordea
Kursus - Apache Spark MLlib
Diterjemahkan Mesin
very interactive...
Richard Langford
Kursus - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kursus - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kursus - Apache Spark in the Cloud
practice tasks