Kerangka Materi

Pengenalan

  • Proses Ilmu Data
  • Peran dan tanggung jawab seorang Data Scientist

Menyiapkan Lingkungan Pengembangan

  • Pustaka, kerangka kerja, bahasa dan alat
  • Pengembangan lokal
  • Pengembangan berbasis web kolaboratif

Pengumpulan Data

  • Jenis-Jenis Data Berbeda
    • Terbentuk
      • Basis data lokal
      • Penghubung basis data
      • Format umum: xlxs, XML, Json, csv, ...
    • Tidak Terbentuk
      • Klik, sensornya, ponsel
      • API
      • Internet of Things (IoT)
      • Dokumen, gambar, video, suara
  • Kasus studi: Mengumpulkan jumlah besar data tidak terbentuk secara terus-menerus

Penyimpanan Data

  • Basis data relasional
  • Basis data non-relasional
  • Hadoop: Distributed File System (HDFS)
  • Spark: Resilient Distributed Dataset (RDD)
  • Penyimpanan cloud

Persiapan Data

  • Pengisian, pemilihan, membersihkan, dan transformasi
  • Memastikan kualitas data - ketepatan, keterkaitan, dan keamanan
  • Laporan kecacatan

Bahasa yang Digunakan untuk Persiapan, Pemerolehan dan Analisis

  • Bahasa R
    • Pengenalan R
    • Manipulasi data, perhitungan, dan tampilan grafis
  • Python
    • Pengenalan Python
    • Memproses, mengolah, membersihkan, dan mengolah data

Analisis Data

  • Analisis eksploratif
    • Statistik dasar
    • Visualisasi awal
    • Mengerti data
  • Kausalitas
  • Fitur dan transformasi
  • Machine Learning
    • Supervised vs unsurpevised
    • Kapan menggunakan model apa
  • Natural Language Processing (NLP)

Visualisasi Data

  • Praktik Terbaik
  • Memilih grafik yang tepat untuk data yang tepat
  • Palet warna
  • Meningkatkan ke tingkat berikutnya
    • Dashboard
    • Visualisasi Interaktif
  • Menceritakan dengan data

Ringkasan dan Kesimpulan

Persyaratan

  • Pemahaman umum mengenai konsep database
  • Pemahaman dasar mengenai statistik
 35 Jam

Jumlah Peserta


Biaya per Peserta

Testimoni (3)

Kursus Mendatang

Kategori Terkait