Kerangka Materi

Dasar-Dasar Klasifikasi Audio

  • Jenis acara suara: lingkungan, mekanik, hasil human-generated
  • Ringkasan kasus penggunaan: pengawasan, pemantauan, otomasi
  • Klasifikasi audio vs deteksi vs segmentasi

Data Audio dan Ekstraksi Fitur

  • Jenis file audio dan format
  • Frekuensi sampling, windowing, pertimbangan ukuran bingkai
  • Mengekstrak MFCCs, fitur chroma, mel-spectrograms

Persiapan Data dan Anotasi

  • UrbanSound8K, ESC-50, dan dataset kustom
  • Penandai acara suara dan batas waktu
  • Mengimbangi dataset dan menambah audio

Membangun Model Klasifikasi Audio

  • Menggunakan jaringan saraf konvolusional (CNNs) untuk audio
  • Input model: gelombang mentah vs fitur
  • Fungsi kerugian, metrik evaluasi, dan overfitting

Pendeteksian Acara dan Lokalisasi Temporal

  • Strategi deteksi berbasis frame dan segmen
  • Mengolah hasil deteksi menggunakan ambang batas dan pengecilan
  • Visualisasi prediksi pada garis waktu audio

Tema Lanjutan dan Pengolahan Real-Time

  • Pelajaran transfer untuk skenario data rendah
  • Mendeploy model dengan TensorFlow Lite atau ONNX
  • Pengolahan audio streaming dan pertimbangan latensi

Perkembangan Proyek dan Skenario Aplikasi

  • Mendirikan pipa penuh: pengambilan hingga klasifikasi
  • Mendapatkan bukti konsep untuk pengawasan, kontrol kualitas, atau pemantauan
  • Pencatatan, peringatan, dan integrasi dengan dasbor atau API

Ringkasan dan Langkah Selanjutnya

Persyaratan

  • Pemahaman konsep pembelajaran mesin dan pelatihan model
  • Pengalaman dengan Python pemrograman dan pra-pemrosesan data
  • Ketahui dasar-dasar audio digital

Audience

  • Ilmuwan data
  • Injiner pembelajaran mesin
  • Peneliti dan pengembang dalam pemrosesan sinyal audio
 21 Jam

Jumlah Peserta


Biaya per Peserta

Kursus Mendatang

Kategori Terkait