Kerangka Materi

Ringkasan Kemampuan Optimisasi CANN

  • Cara pengelolaan kinerja inferensi dalam CANN
  • Tujuan optimisasi untuk sistem AI edge dan embedded
  • Mengerti penggunaan AI Core dan alokasi memori

Menggunakan Graph Engine untuk Analisis

  • Pendahuluan tentang Graph Engine dan pipa eksekusi
  • Memvisualisasikan grafik operator dan metrik runtime
  • Modifikasi grafik komputasi untuk optimisasi

Alat Profiling dan Metrik Kinerja

  • Menggunakan CANN Profiling Tool (profiler) untuk analisis beban kerja
  • Menganalisis waktu eksekusi kernel dan botleneck
  • Profiling akses memori dan strategi tiling

Pengembangan Operator Kustom dengan TIK

  • Ringkasan tentang TIK dan model pemrograman operator
  • Menerapkan operator kustom menggunakan TIK DSL
  • Uji coba dan benchmarking performa operator

Optimisasi Lanjutan Operator dengan TVM

  • Pendahuluan tentang integrasi TVM dengan CANN
  • Strategi auto-tuning untuk grafik komputasi
  • Kapan dan bagaimana beralih antara TVM dan TIK

Teknik Optimisasi Memori

  • Pengelolaan tata letak memori dan penempatan buffer
  • Teknik untuk mengurangi konsumsi memori on-chip
  • Praktik terbaik untuk eksekusi asynchronous dan penggunaan ulang

Penerapan Nyata dan Studi Kasus

  • Studi kasus: penyesuaian performa untuk pipelining kamera smart city
  • Studi kasus: optimisasi tumpukan inferensi kendaraan otonom
  • Panduan untuk profiling berkelanjutan dan perbaikan terus-menerus

Ringkasan dan Langkah Berikutnya

Persyaratan

  • Pemahaman yang kuat tentang arsitektur model deep learning dan alur kerja pelatihan
  • Pengalaman dalam depresiasi model menggunakan CANN, TensorFlow, atau PyTorch
  • Ketahui CLI Linux, shell scripting, dan pemrograman Python

Audience

  • Insinyur performa AI
  • Spesialis optimasi inferensi
  • Pengembang yang bekerja dengan AI edge atau sistem real-time
 14 Jam

Jumlah Peserta


Biaya per Peserta

Kursus Mendatang

Kategori Terkait