Course Outline

Konten pelatihan yang terperinci

  1. Pengantar NLP
    • Mempahami NLP
    • Rangka kerja NLP
    • Aplikasi komersial NLP
    • Mengekstrak data dari web
    • Bekerja dengan berbagai API untuk mengambil data teks
    • Bekerja dan menyimpan korpus teks serta metadata yang relevan
    • Keuntungan menggunakan Python dan kursus singkat NLTK
  2. Pemahaman Praktis tentang Korpus dan Dataset
    • Mengapa kita membutuhkan korpus?
    • Analisis Korpus
    • Jenis atribut data
    • Berbagai format file untuk korpus
    • Mempersiapkan dataset untuk aplikasi NLP
  3. Pemahaman Struktur Kalimat
    • Komponen NLP
    • Pemahaman bahasa alami
    • Analisis morfologis - batang kata, token, tag ucapan
    • Analisis sintaksis
    • Analisis semantik
    • Mengatasi ambiguitas
  4. Pra-pemrosesan data teks
    • Korpus - teks kasar
      • Tokenisasi kalimat
      • Stemming untuk teks kasar
      • Lemmatisasi teks kasar
      • Menghapus kata-kata umum
    • Korpus- kalimat kasar
      • Word tokenisasi
      • Word lemmatisasi
    • Bekerja dengan Matriks Term-Dokumen/Dokumen-Term
    • Tokenisasi teks menjadi n-gram dan kalimat
    • Pra-pemrosesan praktis dan disesuaikan
  5. Menganalisis Data Teks
    • Ciri dasar NLP
      • Parser dan parsing
      • Tagging POS dan tagger
      • Pengenalan entitas bernama
      • N-gram
      • Sampul kata
    • Ciri statistik NLP
      • Konsep aljabar linear untuk NLP
      • Teori probabilitas untuk NLP
      • TF-IDF
      • Vektorisasi
      • Pengkode dan Pengode
      • Normalisasi
      • Model Probabilistik
    • Penyusunan fitur lanjutan dan NLP
      • Dasar-dasar word2vec
      • Komponen model word2vec
      • Logika dari model word2vec
      • Pengembangan konsep word2vec
      • Aplikasi model word2vec
    • Studi kasus: Aplikasi sampul kata: pengeceran teks otomatis menggunakan algoritma Luhn yang disederhanakan dan asli
  6. Klasterisasi Dokumen, Klasifikasi, dan Modelling Topik
    • Klasterisasi dokumen dan penambangan pola (klaster hierarki, k-means, kluster lainnya)
    • Membandingkan dan mengklasifikasikan dokumen menggunakan TFIDF, Jaccard, dan ukuran jarak kosinus
    • Klasifikasi dokumen menggunakan Naïve Bayes dan Entropi Maksimum
  7. Mengidentifikasi Teks Penting Element
    • Menurunkan dimensi: Analisis Komponen Utama, Dekomposisi Nilai Singular non-negative matrix factorization
    • Pemodelan topik dan pengeceran informasi menggunakan Latent Semantic Analysis
  8. Ekstraksi Entitas, Sentiment Analysis, dan Pemodelan Topik Lanjutan
    • Positif vs. negatif: derajat sentimen
    • Theory of Item Response
    • Pengenalan bagian dari ucapan dan aplikasinya: menemukan orang, tempat, dan organisasi yang disebutkan dalam teks
    • Pemodelan topik lanjutan: Latent Dirichlet Allocation
  9. Studi kasus
    • Menambang ulasan pengguna tidak terstruktur
    • Klasifikasi sentimen dan visualisasi data ulasan produk
    • Menambang log pencarian untuk pola penggunaan
    • Klasifikasi teks
    • Pemodelan topik

Requirements

Ketahui dan sadar akan prinsip-prinsip NLP serta menghargai aplikasi AI dalam bisnis

 21 Hours

Number of participants


Price per participant

Testimonials (1)

Upcoming Courses (Minimal 5 peserta)

Related Categories