Terima kasih telah mengirimkan pertanyaan Anda! Salah satu anggota tim kami akan segera menghubungi Anda.
Terima kasih telah mengirimkan pemesanan Anda! Salah satu anggota tim kami akan segera menghubungi Anda.
Kerangka Materi
Rincian outline pelatihan
- Pengenalan ke NLP
- Memahami NLP
- Framework NLP
- Aplikasi komersial NLP
- Scrapping data dari web
- Bekerja dengan berbagai API untuk mengambil data teks
- Bekerja dan menyimpan korpus teks dengan menyimpan konten dan metadata yang relevan
- Keunggulan menggunakan Python dan kursus intensif NLTK
- Pemahaman Praktis tentang Korpus dan Dataset
- Mengapa kita memerlukan korpus?
- Analisis Korpus
- Jenis atribut data
- Format file berbeda untuk korpus
- Menyiapkan dataset untuk aplikasi NLP
- Memahami Struktur Kalimat
- Komponen NLP
- Pemahaman bahasa alami
- Analisis morfologi - kata dasar, kata, token, tag part of speech
- Analisis sintaks
- Analisis semantik
- Menangani ambiguitas
- Pra-pemrosesan data teks
- Korpus- teks mentah
- Tokensasi kalimat
- Stemming untuk teks mentah
- Lematisasi teks mentah
- Penghapusan kata stop
- Korpus-kalimat mentah
- Tokensasi kata
- Lematisasi kata
- Bekerja dengan Matriks Istilah-Dokumen/Dokumen-Istilah
- Tokensasi teks ke n-grams dan kalimat
- Pra-pemrosesan praktis dan tersesuaikan
- Korpus- teks mentah
- Menganalisis Data Teks
- Fitur dasar NLP
- Parser dan parsing
- Tagging POS dan tagger
- Pengenalan entitas bernama
- N-grams
- Bag of words
- Fitur statistik NLP
- Konsep aljabar linear untuk NLP
- Teori probabilistik untuk NLP
- TF-IDF
- Vektorisasi
- Encoder dan Decoder
- Normalisasi
- Model Probabilistik
- Rekayasa fitur lanjutan dan NLP
- Dasar-dasar word2vec
- Komponen model word2vec
- Logika model word2vec
- Ekstensi konsep word2vec
- Aplikasi model word2vec
- Studi kasus: Penerapan bag of words: ringkasan teks otomatis menggunakan algoritma Luhn yang disederhanakan dan sebenarnya
- Fitur dasar NLP
- Klasterisasi Dokumen, Klasifikasi, dan Pemodelan Topik
- Klasterisasi dokumen dan penambangan pola (klasterisasi hierarkis, k-means, klasterisasi, dll.)
- Membandingkan dan mengklasifikasikan dokumen menggunakan ukuran jarak TFIDF, Jaccard, dan kosinus
- Klasifikasi dokumen menggunakan Naïve Bayes dan Maksimum Entropi
- Identifikasi Elemen Teks yang Penting
- Mengurangi dimensi: Analisis Komponen Utama, Dekomposisi Nilai Singular, faktorisasi matriks non-negatif
- Pemodelan topik dan pengambilan informasi menggunakan Analisis Semantik Tersembunyi
- Pengambilan Entitas, Analisis Sentimen, dan Pemodelan Topik Lanjutan
- Positif vs. negatif: tingkat sentimen
- Teori Respons Item
- Tagging part of speech dan penerapannya: menemukan orang, tempat, dan organisasi yang disebutkan dalam teks
- Pemodelan topik lanjutan: Aloksi Diriklet Laten
- Studi kasus
- Menambang ulasan pengguna yang tidak terstruktur
- Klasifikasi sentimen dan visualisasi Data Ulasan Produk
- Menambang log pencarian untuk pola penggunaan
- Klasifikasi teks
- Pemodelan topik
Persyaratan
Pengetahuan dan kesadaran tentang prinsip-prinsip NLP serta apresiasi terhadap penerapan AI dalam bisnis
21 Jam
Testimoni (1)
Dukungan individu
Simon the 2nd - Cboost
Kursus - ROS: Programming for Robotics
Diterjemahkan Mesin