Hubungi Kami

Kerangka Materi

Rincian outline pelatihan

  1. Pengenalan ke NLP
    • Memahami NLP
    • Framework NLP
    • Aplikasi komersial NLP
    • Scrapping data dari web
    • Bekerja dengan berbagai API untuk mengambil data teks
    • Bekerja dan menyimpan korpus teks dengan menyimpan konten dan metadata yang relevan
    • Keunggulan menggunakan Python dan kursus intensif NLTK
  2. Pemahaman Praktis tentang Korpus dan Dataset
    • Mengapa kita memerlukan korpus?
    • Analisis Korpus
    • Jenis atribut data
    • Format file berbeda untuk korpus
    • Menyiapkan dataset untuk aplikasi NLP
  3. Memahami Struktur Kalimat
    • Komponen NLP
    • Pemahaman bahasa alami
    • Analisis morfologi - kata dasar, kata, token, tag part of speech
    • Analisis sintaks
    • Analisis semantik
    • Menangani ambiguitas
  4. Pra-pemrosesan data teks
    • Korpus- teks mentah
      • Tokensasi kalimat
      • Stemming untuk teks mentah
      • Lematisasi teks mentah
      • Penghapusan kata stop
    • Korpus-kalimat mentah
      • Tokensasi kata
      • Lematisasi kata
    • Bekerja dengan Matriks Istilah-Dokumen/Dokumen-Istilah
    • Tokensasi teks ke n-grams dan kalimat
    • Pra-pemrosesan praktis dan tersesuaikan
  5. Menganalisis Data Teks
    • Fitur dasar NLP
      • Parser dan parsing
      • Tagging POS dan tagger
      • Pengenalan entitas bernama
      • N-grams
      • Bag of words
    • Fitur statistik NLP
      • Konsep aljabar linear untuk NLP
      • Teori probabilistik untuk NLP
      • TF-IDF
      • Vektorisasi
      • Encoder dan Decoder
      • Normalisasi
      • Model Probabilistik
    • Rekayasa fitur lanjutan dan NLP
      • Dasar-dasar word2vec
      • Komponen model word2vec
      • Logika model word2vec
      • Ekstensi konsep word2vec
      • Aplikasi model word2vec
    • Studi kasus: Penerapan bag of words: ringkasan teks otomatis menggunakan algoritma Luhn yang disederhanakan dan sebenarnya
  6. Klasterisasi Dokumen, Klasifikasi, dan Pemodelan Topik
    • Klasterisasi dokumen dan penambangan pola (klasterisasi hierarkis, k-means, klasterisasi, dll.)
    • Membandingkan dan mengklasifikasikan dokumen menggunakan ukuran jarak TFIDF, Jaccard, dan kosinus
    • Klasifikasi dokumen menggunakan Naïve Bayes dan Maksimum Entropi
  7. Identifikasi Elemen Teks yang Penting
    • Mengurangi dimensi: Analisis Komponen Utama, Dekomposisi Nilai Singular, faktorisasi matriks non-negatif
    • Pemodelan topik dan pengambilan informasi menggunakan Analisis Semantik Tersembunyi
  8. Pengambilan Entitas, Analisis Sentimen, dan Pemodelan Topik Lanjutan
    • Positif vs. negatif: tingkat sentimen
    • Teori Respons Item
    • Tagging part of speech dan penerapannya: menemukan orang, tempat, dan organisasi yang disebutkan dalam teks
    • Pemodelan topik lanjutan: Aloksi Diriklet Laten
  9. Studi kasus
    • Menambang ulasan pengguna yang tidak terstruktur
    • Klasifikasi sentimen dan visualisasi Data Ulasan Produk
    • Menambang log pencarian untuk pola penggunaan
    • Klasifikasi teks
    • Pemodelan topik

Persyaratan

Pengetahuan dan kesadaran tentang prinsip-prinsip NLP serta apresiasi terhadap penerapan AI dalam bisnis

 21 Jam

Jumlah Peserta


Harga per Peserta

Testimoni (1)

Kursus Mendatang

Kategori Terkait