Kerangka Materi
Perkenalan
Pemahaman Big Data
Ikhtisar percikan
Ikhtisar Python
Ikhtisar PySpark
- Mendistribusikan Data Menggunakan Kerangka Kumpulan Data Terdistribusi yang Tangguh
- Mendistribusikan Komputasi Menggunakan Operator Spark API
Menyiapkan Python dengan Spark
Menyiapkan PySpark
Menggunakan Instans EC2 Amazon Web Services (AWS) untuk Spark
Menyiapkan Databricks
Menyiapkan Klaster AWS EMR
Mempelajari Dasar-Dasar Python Programming
- Memulai dengan Python
- Menggunakan Buku Catatan Jupyter
- Menggunakan Variabel dan Tipe Data Sederhana
- Bekerja dengan Daftar
- Menggunakan Pernyataan if
- Menggunakan Input Pengguna
- Bekerja dengan while Loops
- Fungsi Pelaksana
- Bekerja dengan Kelas
- Bekerja dengan File dan Pengecualian
- Bekerja dengan Proyek, Data, dan API
Mempelajari Dasar-dasar Spark DataFrame
- Memulai dengan Spark DataFrames
- Menerapkan Operasi Dasar dengan Spark
- Menggunakan Operasi Groupby dan Agregat
- Bekerja dengan Stempel Waktu dan Tanggal
Mengerjakan Latihan Proyek Spark DataFrame
Memahami Machine Learning dengan MLlib
Bekerja dengan MLlib, Spark, dan Python untuk Machine Learning
Memahami Regresi
- Belajar Teori Regresi Linier
- Menerapkan Kode Evaluasi Regresi
- Mengerjakan Contoh Latihan Regresi Linier
- Belajar Teori Regresi Logistik
- Menerapkan Kode Regresi Logistik
- Mengerjakan Contoh Latihan Regresi Logistik
Pemahaman Random Forest dan Pohon Keputusan
- Teori Metode Pohon Pembelajaran
- Menerapkan Pohon Keputusan dan Random Forest Kode
- Mengerjakan Contoh Random Forest Latihan Klasifikasi
Bekerja dengan Pengelompokan K-means
- Memahami Teori Clustering K-means
- Menerapkan Kode Clustering K-means
- Mengerjakan Contoh Latihan Pengelompokan
Bekerja dengan Sistem Rekomendasi
Menerapkan Pemrosesan Bahasa Alami
- Pemahaman Natural Language Processing (NLP)
- Ikhtisar Alat NLP
- Mengerjakan Contoh Latihan NLP
Streaming dengan Spark di Python
- Ikhtisar Streaming dengan Spark
- Contoh Spark Streaming Latihan
Kata penutup
Persyaratan
- Keterampilan pemrograman umum
Hadirin
- Pengembang
- Profesional TI
- Ilmuwan Data
Testimoni (6)
Saya suka karena praktis. Saya senang dapat menerapkan pengetahuan teoritis dengan contoh-contoh praktis.
Aurelia-Adriana - Allianz Services Romania
Kursus - Python and Spark for Big Data (PySpark)
Diterjemahkan Mesin
Kursus ini membahas serangkaian topik terkait yang sangat kompleks, dan Pablo memiliki keahlian mendalam tentang masing-masingnya. Terkadang nuansa hilang dalam komunikasi dan/atau karena tekanan waktu, sehingga mungkin harapan tidak sepenuhnya terpenuhi karena hal ini. Selain itu, ada beberapa masalah setup UHG/Azure Databricks, namun Pablo/UHG menyelesaikannya dengan cepat begitu masalah tersebut terlihat - bagi saya, ini menunjukkan tingkat pemahaman dan profesionalisme yang tinggi antara UHG dan Pablo,
Michael Monks - Tech NorthWest Skillnet
Kursus - Python and Spark for Big Data (PySpark)
Diterjemahkan Mesin
Perhatian individual.
ARCHANA ANILKUMAR - PPL
Kursus - Python and Spark for Big Data (PySpark)
Diterjemahkan Mesin
Pelatihan Praktis..
Abraham Thomas - PPL
Kursus - Python and Spark for Big Data (PySpark)
Diterjemahkan Mesin
Pelajaran diajarkan dalam notebook Jupyter. Topik-topik disusun dengan urutan logis dan secara alami membantu mengembangkan sesi dari bagian yang lebih mudah ke bagian yang lebih kompleks. Saya sudah menjadi pengguna lanjutan Python dengan latar belakang Machine Learning, jadi saya menemukan kursus ini lebih mudah diikuti dibandingkan beberapa teman sekelas yang mengambil pelatihan tersebut. Saya menghargai bahwa beberapa konsep paling dasar dilewati dan dia fokus pada masalah-masalah yang paling substansial.
Angela DeLaMora - ADT, LLC
Kursus - Python and Spark for Big Data (PySpark)
Diterjemahkan Mesin
tugas praktik
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kursus - Python and Spark for Big Data (PySpark)
Diterjemahkan Mesin