Kerangka Materi

spark.mllib: tipe data, algoritma, dan utilitas

  • Tipe data
  • Statistika dasar
    • statistika ringkasan
    • korelasi
    • sampling stratifikasi
    • pengujian hipotesis
    • pengujian signifikan streaming
    • pembuatan data acak
  • Klasifikasi dan regresi
    • model linear (SVMs, regresi logistik, regresi linear)
    • naive Bayes
    • pohon keputusan
    • ensembel pohon (Random Forests dan Gradient-Boosted Trees)
    • regresi isotonic
  • Filtering kolaboratif
    • alternating least squares (ALS)
  • Kelompokkan
    • k-means
    • campuran Gaussian
    • power iteration clustering (PIC)
    • latent Dirichlet allocation (LDA)
    • bisecting k-means
    • streaming k-means
  • Pengurangan dimensi
    • singular value decomposition (SVD)
    • principal component analysis (PCA)
  • Ekstraksi dan transformasi fitur
  • Pertambangan pola frekuensi
    • FP-growth
    • aturan asosiasi
    • PrefixSpan
  • Metrik evaluasi
  • Ekspor model PMML
  • Optimasi (pengembang)
    • stochastic gradient descent
    • limited-memory BFGS (L-BFGS)

spark.ml: API tingkat tinggi untuk pipeline ML

  • Overview: estimators, transformers dan pipelines
  • Ekstraksi, transformasi dan pemilihan fitur
  • Klasifikasi dan regresi
  • Kelompokkan
  • Topik lanjutan

Persyaratan

Pengetahuan salah satu dari berikut ini:
  • Java
  • Scala
  • Python
  • SparkR.
 35 Jam

Jumlah Peserta


Biaya per Peserta

Testimoni (1)

Kursus Mendatang

Kategori Terkait