Course Outline

Pengantar

  • Mengerti pentingnya persiapan data dalam analitik dan machine learning
  • Saluran persiapan data dan perannya dalam siklus hidup data
  • Mengamati tantangan umum pada data mentah dan dampaknya terhadap analisis

Pemungutan dan Pengambilan Data

  • Sumber data: database, API, spreadsheet, file teks, dan lain-lain
  • Teknik untuk mengumpulkan data dan memastikan kualitas data selama pengumpulan
  • Mengumpulkan data dari berbagai sumber

Data Cleaning Teknik

  • Menentukan dan menangani nilai yang hilang, outlier, dan ketidakkonsistenan
  • Menangani duplikat dan kesalahan dalam dataset
  • Membersihkan dataset dunia nyata

Pemrosesan dan Standardisasi Data

  • Teknik normalisasi dan standardisasi data
  • Penanganan data kategorikal: encoding, binning, dan feature engineering
  • Mengubah data mentah menjadi format yang dapat digunakan

Data Integration dan Agregasi

  • Merging dan menggabungkan dataset dari berbagai sumber
  • Menyelesaikan konflik data dan menyesuaikan jenis data
  • Teknik untuk agregasi dan konsolidasi data

Data Quality Jaminan

  • Metode untuk memastikan kualitas dan integritas data selama proses
  • Melaksanakan pengecekan kualitas dan prosedur validasi
  • Studi kasus dan aplikasi praktis jaminan kualitas data

Pengurangan Dimensi dan Pemilihan Fitur

  • Mempahami kebutuhan pengurangan dimensi
  • Teknik seperti PCA, pemilihan fitur, dan strategi reduksi
  • Menjalankan teknik pengurangan dimensi

Rangkuman dan Langkah Berikutnya

Requirements

  • Pemahaman dasar tentang konsep data

Audience

  • Analisis data
  • Database administrator
  • Profesional IT
 14 Hours

Number of participants


Price per participant

Testimonials (2)

Upcoming Courses (Minimal 5 peserta)

Related Categories