Kerangka Materi
Pendahuluan tentang Google Colab dan Apache Spark
- Ringkasan tentang Google Colab
- Pendahuluan tentang Apache Spark
- Mengatur Spark di Google Colab
Pengolahan Data dengan Apache Spark
- Bekerja dengan RDDs dan DataFrames
- Memuat dan memproses dataset yang besar
- Menggunakan Spark SQL untuk mengquery data terstruktur
Analitik Lanjutan dengan Spark
- Machine learning dengan Spark MLlib
- Melakukan analisis data real-time
- Komputasi terdistribusi dengan Spark
Visualisasi dan Collaboration di Google Colab
- Mengintegrasikan Colab dengan perpustakaan visualisasi populer
- Kolaborasi kerja dengan notebook Colab
- Berbagi dan mengekspor hasil
Optimalisasi Workflows Big Data
- Menyesuaikan Spark untuk kinerja
- Mengoptimalkan penggunaan memori dan penyimpanan
- Skalabilitas workflow untuk dataset yang besar
Big Data di Cloud
- Mengintegrasikan Google Colab dengan alat berbasis cloud
- Menggunakan penyimpanan cloud untuk big data
- Bekerja dengan Spark di lingkungan cloud terdistribusi
Studi Kasus dan Best Practices
- Tinjauan aplikasi big data dunia nyata
- Studi kasus menggunakan Apache Spark dan Colab
- Best practices untuk analitik big data
Ringkasan dan Langkah Selanjutnya
Persyaratan
- Pengetahuan dasar tentang konsep ilmu data
- Kesederhanaan dengan Apache Spark
- Keterampilan pemrograman Python
Audiens
- Ilmuwan data
- Insinyur data
- Peneliti yang bekerja dengan big data
Testimoni (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Kursus - ArcGIS Fundamentals
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Kursus - QGIS for Geographic Information System
Saya menyukai gaya Pablo, fakta bahwa ia mencakup banyak subjek mulai dari desain laporan, penyesuaian dengan html hingga penerapan algoritma ML sederhana. Go informasi / latihan teoretis yang seimbang. Pablo benar-benar membahas semua topik yang saya minati dan memberikan jawaban komprehensif atas pertanyaan saya.
Cristian Tudose - SC Automobile Dacia SA
Kursus - Advanced Data Analysis with TIBCO Spotfire
Diterjemahkan Mesin
The thing I liked the most about the training was the organization and the location
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Kursus - ArcGIS for Spatial Analysis
I genuinely enjoyed the lots of labs and practices.