Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
Pengantar
- Mengerti pentingnya persiapan data dalam analitik dan machine learning
- Saluran persiapan data dan perannya dalam siklus hidup data
- Mengamati tantangan umum pada data mentah dan dampaknya terhadap analisis
Pemungutan dan Pengambilan Data
- Sumber data: database, API, spreadsheet, file teks, dan lain-lain
- Teknik untuk mengumpulkan data dan memastikan kualitas data selama pengumpulan
- Mengumpulkan data dari berbagai sumber
Data Cleaning Teknik
- Menentukan dan menangani nilai yang hilang, outlier, dan ketidakkonsistenan
- Menangani duplikat dan kesalahan dalam dataset
- Membersihkan dataset dunia nyata
Pemrosesan dan Standardisasi Data
- Teknik normalisasi dan standardisasi data
- Penanganan data kategorikal: encoding, binning, dan feature engineering
- Mengubah data mentah menjadi format yang dapat digunakan
Data Integration dan Agregasi
- Merging dan menggabungkan dataset dari berbagai sumber
- Menyelesaikan konflik data dan menyesuaikan jenis data
- Teknik untuk agregasi dan konsolidasi data
Data Quality Jaminan
- Metode untuk memastikan kualitas dan integritas data selama proses
- Melaksanakan pengecekan kualitas dan prosedur validasi
- Studi kasus dan aplikasi praktis jaminan kualitas data
Pengurangan Dimensi dan Pemilihan Fitur
- Mempahami kebutuhan pengurangan dimensi
- Teknik seperti PCA, pemilihan fitur, dan strategi reduksi
- Menjalankan teknik pengurangan dimensi
Rangkuman dan Langkah Berikutnya
Requirements
- Pemahaman dasar tentang konsep data
Audience
- Analisis data
- Database administrator
- Profesional IT
14 Hours
Testimonials (2)
It's a hands-on session.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Course - Talend Open Studio for ESB
I generally enjoyed the knowledge of the trainer.