Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
Konten pelatihan yang terperinci
- Pengantar NLP
- Mempahami NLP
- Rangka kerja NLP
- Aplikasi komersial NLP
- Mengekstrak data dari web
- Bekerja dengan berbagai API untuk mengambil data teks
- Bekerja dan menyimpan korpus teks serta metadata yang relevan
- Keuntungan menggunakan Python dan kursus singkat NLTK
- Pemahaman Praktis tentang Korpus dan Dataset
- Mengapa kita membutuhkan korpus?
- Analisis Korpus
- Jenis atribut data
- Berbagai format file untuk korpus
- Mempersiapkan dataset untuk aplikasi NLP
- Pemahaman Struktur Kalimat
- Komponen NLP
- Pemahaman bahasa alami
- Analisis morfologis - batang kata, token, tag ucapan
- Analisis sintaksis
- Analisis semantik
- Mengatasi ambiguitas
- Pra-pemrosesan data teks
- Korpus - teks kasar
- Tokenisasi kalimat
- Stemming untuk teks kasar
- Lemmatisasi teks kasar
- Menghapus kata-kata umum
- Korpus- kalimat kasar
- Word tokenisasi
- Word lemmatisasi
- Bekerja dengan Matriks Term-Dokumen/Dokumen-Term
- Tokenisasi teks menjadi n-gram dan kalimat
- Pra-pemrosesan praktis dan disesuaikan
- Korpus - teks kasar
- Menganalisis Data Teks
- Ciri dasar NLP
- Parser dan parsing
- Tagging POS dan tagger
- Pengenalan entitas bernama
- N-gram
- Sampul kata
- Ciri statistik NLP
- Konsep aljabar linear untuk NLP
- Teori probabilitas untuk NLP
- TF-IDF
- Vektorisasi
- Pengkode dan Pengode
- Normalisasi
- Model Probabilistik
- Penyusunan fitur lanjutan dan NLP
- Dasar-dasar word2vec
- Komponen model word2vec
- Logika dari model word2vec
- Pengembangan konsep word2vec
- Aplikasi model word2vec
- Studi kasus: Aplikasi sampul kata: pengeceran teks otomatis menggunakan algoritma Luhn yang disederhanakan dan asli
- Ciri dasar NLP
- Klasterisasi Dokumen, Klasifikasi, dan Modelling Topik
- Klasterisasi dokumen dan penambangan pola (klaster hierarki, k-means, kluster lainnya)
- Membandingkan dan mengklasifikasikan dokumen menggunakan TFIDF, Jaccard, dan ukuran jarak kosinus
- Klasifikasi dokumen menggunakan Naïve Bayes dan Entropi Maksimum
- Mengidentifikasi Teks Penting Element
- Menurunkan dimensi: Analisis Komponen Utama, Dekomposisi Nilai Singular non-negative matrix factorization
- Pemodelan topik dan pengeceran informasi menggunakan Latent Semantic Analysis
- Ekstraksi Entitas, Sentiment Analysis, dan Pemodelan Topik Lanjutan
- Positif vs. negatif: derajat sentimen
- Theory of Item Response
- Pengenalan bagian dari ucapan dan aplikasinya: menemukan orang, tempat, dan organisasi yang disebutkan dalam teks
- Pemodelan topik lanjutan: Latent Dirichlet Allocation
- Studi kasus
- Menambang ulasan pengguna tidak terstruktur
- Klasifikasi sentimen dan visualisasi data ulasan produk
- Menambang log pencarian untuk pola penggunaan
- Klasifikasi teks
- Pemodelan topik
Requirements
Ketahui dan sadar akan prinsip-prinsip NLP serta menghargai aplikasi AI dalam bisnis
21 Hours
Testimonials (1)
I feel I get the core skills I need to understand how the ROS fits together, and how to structure projects in it.