Kerangka Materi

Dasar-dasar AI yang Aman dan Adil

  • Konsep utama: keamanan, bias, keadilan, transparansi
  • Jenis-jenis bias: dataset, representasi, algoritma
  • Ringkasan kerangka peraturan (EU AI Act, GDPR, dll.)

Bias dalam Model yang Disesuaikan Ulang

  • Cara fine-tuning dapat memperkenalkan atau memperkuat bias
  • Kasus studi dan kegagalan dunia nyata
  • Mengidentifikasi bias dalam dataset dan prediksi model

Teknik Mitigasi Bias

  • Strategi tingkat data (rebalancing, augmentasi)
  • Strategi selama pelatihan (regularisasi, adversarial debiasing)
  • Strategi pasca-pemrosesan (filtering output, kalibrasi)

Keamanan dan Kekuatan Model

  • Mendeteksi output yang tidak aman atau berbahaya
  • Penanganan input adversarial
  • Percobaan red team dan pengujian stres pada model yang disesuaikan ulang

Audit dan Monitoring Sistem AI

  • Metrik evaluasi bias dan keadilan (misalnya, parity demografis)
  • Alat keterjelasan dan kerangka transparansi
  • Pemantauan berkelanjutan dan praktik tata kelola

Kotak Peralatan dan Praktek Tangani

  • Menggunakan perpustakaan open-source (misalnya, Fairlearn, Transformers, CheckList)
  • Praktek langsung: Mendeteksi dan mengurangi bias dalam model yang disesuaikan ulang
  • Menghasilkan output yang aman melalui desain prompt dan pembatasan

Kasus Penggunaan Perusahaan dan Siap Kepatuhan

  • Praktek terbaik untuk mengintegrasikan keamanan dalam workflow LLM
  • Dokumentasi dan kartu model untuk kepatuhan
  • Bersiap untuk audit dan tinjauan eksternal

Ringkasan dan Langkah Selanjutnya

Persyaratan

  • Pemahaman tentang model pembelajaran mesin dan proses pelatihan
  • Pengalaman bekerja dengan fine-tuning dan LLMs
  • Keterampilan dalam Python dan konsep NLP

Audience

  • Tim kepatuhan AI
  • Insinyur ML
 14 Jam

Jumlah Peserta


Biaya per Peserta

Kursus Mendatang

Kategori Terkait