Kerangka Materi

Pengenalan

  • Proses Ilmu Data
  • Peran dan tanggung jawab seorang Ilmuwan Data

Menyiapkan Lingkungan Pengembangan

  • Perpustakaan, kerangka kerja, bahasa dan alat
  • Pengembangan lokal
  • Pengembangan berbasis web kolaboratif

Pengumpulan Data

  • Jenis-jenis Data Berbeda
    • Terstruktur
      • Basis data lokal
      • Penghubung basis data
      • Format umum: xlxs, XML, Json, csv, ...
    • Tidak Terstruktur
      • Klik, sensor, smartphone
      • API
      • Internet of Things (IoT)
      • Dokumen, gambar, video, suara
  • Studi kasus: Mengumpulkan jumlah data tidak terstruktur yang besar secara berkelanjutan

Penyimpanan Data

  • Basis data relasional
  • Basis data non-relasional
  • Hadoop: Sistem Berkas Terdistribusi (HDFS)
  • Spark: Dataset Terdistribusi yang Tahan Gagal (RDD)
  • Penyimpanan awan

Persiapan Data

  • Ingest, seleksi, pembersihan, dan transformasi
  • Memastikan kualitas data - kebenaran, makna, dan keamanan
  • Laporan pengecualian

Bahasa yang Digunakan untuk Persiapan, Pengolahan, dan Analisis

  • Bahasa R
    • Pengenalan ke R
    • Manipulasi data, perhitungan dan tampilan grafis
  • Python
    • Pengenalan ke Python
    • Manipulasi, pengolahan, pembersihan, dan analisis data

Analisis Data

  • Analisis eksplorasi
    • Statistik dasar
    • Visualisasi awal
    • Pemahaman data
  • Kausalitas
  • Fitur dan transformasi
  • Pembelajaran Mesin (Machine Learning)
    • Terpandu vs Tidak Terpandu
    • Kapan harus menggunakan model tertentu
  • Pemrosesan Bahasa Alami (NLP)

Visualisasi Data

  • Praktik Terbaik
  • Memilih grafik yang tepat untuk data tertentu
  • Palet warna
  • Mengambil langkah selanjutnya
    • Dasbor
    • Visualisasi interaktif
  • Menyampaikan cerita dengan data

Ringkasan dan Kesimpulan

Persyaratan

  • Pemahaman umum tentang konsep basis data
  • Pemahaman dasar tentang statistik
 35 Jam

Jumlah Peserta


Biaya per Peserta

Testimoni (1)

Kursus Mendatang

Kategori Terkait