Kerangka Materi
Pendahuluan Apache Spark
- Peran Spark dalam pengolahan data besar
- Arsitektur Spark dan komponennya
Mempersiapkan Apache Spark
- Persyaratan perangkat keras dan perangkat lunak
- Tahapan instalasi untuk mode berdiri sendiri dan kluster
- Terbaik praktik konfigurasi untuk administrator sistem
Mengelola Kluster Spark
- Alat dan teknik manajemen kluster
- Memantau aplikasi Spark dan sumber daya kluster
- Konfigurasi keamanan dan manajemen pengguna
Penyesuaian Kinerja dan Optimasi
- Alokasi sumber daya dan penjadwalan
- Menyesuaikan Spark untuk kinerja optimal
- Mengenali dan menyelesaikan masalah umpan
Penyelesaian Masalah dan Penyelesaian Masalah
- Tantangan administrasi Spark yang umum
- Alat dan teknik diagnostik untuk penyelesaian masalah
- Langkah demi langkah pendekatan untuk menyelesaikan masalah umum
- Terbaik praktik untuk memelihara lingkungan Spark yang sehat
Topik Administrasi Lanjut
- Integrasi dengan alat data besar lainnya
- Memastikan ketersediaan tinggi dan pemulihan bencana
- Memperbarui dan meningkatkan skalabilitas kluster Spark
Ringkasan dan Langkah Selanjutnya
Persyaratan
- Pengetahuan dasar tentang konfigurasi dan manajemen jaringan
- Kenalan dengan sistem operasi Linux dan antarmuka baris perintah
- Minat untuk belajar tentang sistem komputasi terdistribusi dan manajemen data besar
Target Peserta
- Administrator sistem
Testimoni (5)
Kenyataan bahwa kita dapat membawa pulang sebagian besar informasi/materi/presentasi/latihan yang telah dilakukan, sehingga kita dapat kembali melihatnya dan mungkin mengulangi apa yang tidak kami pahami pada awalnya atau memperbaiki apa yang sudah kami lakukan.
Raul Mihail Rat - Accenture Industrial SS
Kursus - Python, Spark, and Hadoop for Big Data
Diterjemahkan Mesin
sangat interaktif...
Richard Langford
Kursus - SMACK Stack for Data Science
Diterjemahkan Mesin
Cukup praktis, instruktur sangat berpengetahuan
Chris Tan
Kursus - A Practical Introduction to Stream Processing
Diterjemahkan Mesin
Berlatihlah dengan Spark Streaming, Databricks, dan AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kursus - Apache Spark in the Cloud
Diterjemahkan Mesin
tugas praktik
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kursus - Python and Spark for Big Data (PySpark)
Diterjemahkan Mesin