Kerangka Materi
Pengenalan Apache Iceberg
- Tinjauan umum Apache Iceberg
- Ulasan konsep dasar
Penjelajaban dalam Arsitektur Iceberg
- Analisis mendalam format tabel Iceberg
- Tinjauan rinci arsitektur, termasuk metadata dan tata letak file
- Internals dari evolusi skema dan partisi
Instalasi dan Konfigurasi Lanjut
- Mengkonfigurasi Iceberg untuk kinerja optimal dalam berbagai lingkungan
- Integrasi dengan berbagai mesin pengolahan data
- Pengaturan lanjut: keamanan, enkripsi, dan kontrol akses
- Menyiapkan Iceberg di lingkungan terdistribusi
Operasi dan Pemerataan Lanjut
- Mengelola tabel Iceberg skala besar
- Menerapkan dan mengelola perubahan skema yang kompleks
- Menanganani evolusi partisi dan partisi tersembunyi
- Operasi CRUD lanjut dengan perubahan skema dan partisi
Teknik Optimasi Query
- Teknik untuk mengurangi latensi query
- Pemerataan partisi dan pemerataan file
- Penyimpanan cache metadata dan strategi optimasi
- Menerapkan dan menguji teknik optimasi query
Perbaikan Kinerja untuk Dataset Besar
- Memperbaiki kinerja untuk dataset skala besar
- Menggunakan fitur Iceberg yang terintegrasi untuk perbaikan kinerja
- Studi kasus tentang perbaikan kinerja dalam skenario dunia nyata
- Menyesuaikan kinerja untuk dataset skala besar
Migrasi dan Integrasi Data Lanjut
- Migrasi struktur data kompleks dari sistem lain
- Mengintegrasikan Iceberg dengan aliran data real-time
- Migrasi dataset kompleks dan integrasi aliran data real-time
Keandalan dan Konsistensi
- Memastikan konsistensi dan integritas data dalam lingkungan terdistribusi
- Menerapkan dan mengelola jaminan transaksi
- Menanganani gagal dan mekanisme pemulihan
- Menerapkan fitur keandalan dan konsistensi
Fitur dan Kustomisasi Lanjut
- Implementasi katalog kustom
- Memperluas Iceberg dengan fitur kustom
- Menerapkan katalog kustom dan memperluas fitur Iceberg
Pemerintahan Data dan Ketertiban
- Menerapkan kebijakan pemerintahan data
- Ketertiban dengan peraturan data
- Mengelola jejak audit dan garis keturunan data
- Menerapkan fitur pemerintahan dan ketertiban
Ringkasan dan Langkah Selanjutnya
Persyaratan
- Ketrampilan dalam konsep dasar, operasi dasar, dan manajemen tabel Iceberg
Penonton
- Data engineer
- Data architect
- Data analyst
- Software developer
Testimoni (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Kursus - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Kursus - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kursus - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kursus - Apache Spark in the Cloud
practice tasks