Kursus Pelatihan Performance Optimization on Ascend, Biren, and Cambricon
Ascend, Biren, dan Cambricon adalah platform hardware AI terkemuka di China, masing-masing menawarkan alat pengoptimalan dan pemrofilan unik untuk beban kerja AI skala produksi.
Pelatihan langsung ini (daring atau tatap muka) ditujukan bagi insinyur infrastruktur AI tingkat lanjut dan peningkatan kinerja yang ingin mengoptimalkan aliran kerja inferensi model dan pelatihan di beberapa platform chip AI China.
Setelah selesai, peserta akan dapat:
- Menjalankan benchmark model pada platform Ascend, Biren, dan Cambricon.
- Mengidentifikasi botleneck sistem dan ketidakefisienan memori/perhitungan.
- Menerapkan optimasi tingkat grafik, kernel, dan operator.
- Mempersiapkan pipa_deployemen untuk meningkatkan throughput dan latensi.
Format Kursus
- Ledakan interaktif dan diskusi.
- Penggunaan praktis alat pemrofilan dan pengoptimalan di setiap platform.
- Melakukan latihan yang difokuskan pada skenario penyetelan praktis.
Opsi Personalisasi Kursus
- Untuk meminta pelatihan terpersonalisasi berdasarkan lingkungan kinerja atau jenis model Anda, silakan hubungi kami untuk mengatur.
Kerangka Materi
Konsep dan Metrik Kinerja
- Lantai, throughput, penggunaan daya, utilitas sumber daya
- Tambatan pada tingkat sistem vs model
- Profil untuk inferensi vs pelatihan
Profiling di Huawei Ascend
- Menggunakan CANN Profiler dan MindInsight
- Diganosa kernel dan operator
- Pola offload dan pemetaan memori
Profil di Biren GPU
- Cara mengecek kinerja Biren SDK
- Fusi kernel, penyelarasan memori, dan antrian eksekusi
- Profil yang memperhatikan daya dan suhu
Profiling di Cambricon MLU
- Alat kinerja BANGPy dan Neuware
- Keterlihatan tingkat kernel dan interpretasi log
- Integrasi profilir MLU dengan kerangka penerapan
Optimisasi Tingkat Grafik dan Model
- Stra tegi pemotongan grafik dan kuantifikasi
- Fusi operator dan restrukturisasi grafik komputasi
- Standarisasi ukuran input dan penyetelan batch
Optimisasi Memori dan Kernel
- Mengoptimalkan susunan memori dan penggunaan kembali
- Pengelolaan buffer yang efisien di antara chipset
- Teknik penyetelan tingkat kernel per platform
Praktik Terbaik lintas Platform
- Portabilitas performa: strategi abstraksi
- Membangun pipa penyetelan bersama untuk lingkungan multipel chipset
- Contoh: menyesuaikan model deteksi objek di antara Ascend, Biren, dan MLU
Ringkasan dan Langkah Berikutnya
Persyaratan
- Pengalaman bekerja dengan pipa AI model training atau deployment
- Pemahaman tentang prinsip komputasi GPU/MLU dan optimisasi model
- Ketahui dasar-dasar alat profil kinerja dan metriknya
Audience
- Engineer performa
- Tim infrastruktur machine learning
- Architect sistem AI
Kursus Pelatihan Terbuka membutuhkan minimal 5 peserta.
Kursus Pelatihan Performance Optimization on Ascend, Biren, and Cambricon - Booking
Kursus Pelatihan Performance Optimization on Ascend, Biren, and Cambricon - Enquiry
Performance Optimization on Ascend, Biren, and Cambricon - Permintaan Konsultasi
Permintaan Konsultasi
Kursus Mendatang
Kursus Terkait
Mengembangkan Aplikasi AI dengan Huawei Ascend dan CANN
21 JamHuawei Ascend adalah keluarga pemroses AI yang dirancang untuk inferensi dan pelatihan berkinerja tinggi.
Pelatihan langsung yang dipandu instruktur ini (daring atau di tempat) ditujukan bagi insinyur AI tingkat menengah dan ilmuwan data yang ingin mengembangkan dan memperbaiki model jaringan saraf menggunakan platform Ascend dari Huawei dan kotak alat CANN.
Pada akhir pelatihan ini, peserta akan dapat:
- Menyiapkan dan mengonfigurasi lingkungan pengembangan CANN.
- Mengembangkan aplikasi AI menggunakan MindSpore dan aliran kerja CloudMatrix.
- Memperbaiki kinerja di Ascend NPU menggunakan operator custom dan tiling.
- Mendeploy model ke lingkungan edge atau cloud.
Format Kursus
- Sesi presentasi interaktif dan diskusi.
- Penggunaan langsung Huawei Ascend dan kotak alat CANN dalam aplikasi contoh.
- Latihan terarah yang difokuskan pada pembangunan, pelatihan, dan deploy model.
Pilihan Kustomisasi Kursus
- Untuk meminta pelatihan kustom berdasarkan infrastruktur atau dataset Anda, silakan hubungi kami untuk mengatur.
Deploying AI Models dengan CANN dan Prosesor Ascend AI
14 JamCANN (Arsitektur Komputasi untuk Neural Networks) adalah tumpukan komputasi AI Huawei untuk mendepiskan dan mengoptimalkan model AI pada pemroses AI Ascend.
Pelatihan ini yang dibimbing instruktur secara langsung (online atau tatap muka) ditujukan untuk pengembang AI dan insinyur tingkat menengah yang ingin dengan efisien mendepiskan model AI yang telah dilatih ke perangkat keras Huawei Ascend menggunakan paket peralatan dan alat CANN seperti MindSpore, TensorFlow, atau PyTorch.
Di akhir pelatihan ini, peserta akan mampu untuk:
- Memahami arsitektur CANN dan perannya dalam pipa deployment AI.
- Mengkonversi dan menyesuaikan model dari framework populer ke format yang kompatibel dengan Ascend.
- Menggunakan alat seperti ATC, OM model conversion, dan MindSpore untuk inferensi edge dan cloud.
- Mengdiagnosis masalah deployment dan mengoptimalkan kinerja di perangkat keras Ascend.
Format Kursus
- Presentasi interaktif dan demonstrasi.
- Pekerjaan lab hands-on menggunakan alat CANN dan simulator atau perangkat Ascend.
- Scenarios deployment praktis berdasarkan model AI dunia nyata.
Opsi Kustomisasi Kursus
- Untuk meminta pelatihan kustom untuk kursus ini, silakan hubungi kami untuk mengatur.
Penalaran AI dan Penerapan dengan CloudMatrix
21 JamCloudMatrix adalah platform pengembangan dan penyebaran AI terintegrasi Huawei yang dirancang untuk mendukung pipa inferensi tingkat produksi yang dapat diukur.
Pelatihan langsung ini (online atau tatap muka) ditujukan untuk profesional AI pemula hingga menengah yang ingin meng-deploy dan memantau model AI menggunakan platform CloudMatrix dengan integrasi CANN dan MindSpore.
Pada akhir pelatihan ini, peserta akan mampu:
- Menggunakan CloudMatrix untuk pengemasan model, deployment, dan pengaturan layanan.
- Mengonversi dan mengoptimalkan model untuk chipset Ascend.
- Menyiapkan pipa untuk tugas inferensi real-time dan batch.
- Memantau deployment dan menyesuaikan kinerja dalam pengaturan produksi.
Format Kursus
- Diskusi dan perbincangan interaktif.
- Penggunaan langsung CloudMatrix dengan skenario deployment nyata.
- Latihan yang dipandu yang difokuskan pada konversi, optimasi, dan skalabilitas.
Opsi Kustomisasi Kursus
- Untuk meminta pelatihan khusus untuk kursus ini berdasarkan infrastruktur AI atau lingkungan cloud Anda, silakan hubungi kami untuk menyiapkannya.
GPU Programming di Biren AI Accelerators
21 JamPenghantar Biren AI adalah perangkat yang mampu melaksanakan tugas dengan kinerja tinggi yang dirancang untuk tugas AI dan HPC dengan dukungan untuk pelatihan dan inferensi berukuran besar.
Pelatihan ini yang dipimpin instruktur dan secara langsung (online atau langsung tatap muka) ditujukan untuk pengembang tingkat menengah hingga tingkat lanjut yang ingin memprogram dan mengoptimalkan aplikasi menggunakan tumpukan properti Biren GPU, dengan perbandingan praktis dengan lingkungan berbasis CUDA.
Setelah menyelesaikan pelatihan ini, peserta akan dapat:
- Memahami arsitektur dan tatanan memori Biren GPU.
- Mengatur lingkungan pengembangan dan menggunakan model pemrograman Biren.
- Menerjemahkan dan mengoptimalkan kode gaya CUDA untuk platform Biren.
- Menerapkan teknik penuningan dan pembelokkan kinerja.
Format Pelatihan
- Pembahasan dan diskusi interaktif.
- Penggunaan langsung SDK Biren dalam beban kerja GPU contoh.
- Latihan yang dipandu yang berfokus pada porting dan penuningan kinerja.
Opsi Penyesuaian Pelatihan
- Untuk meminta pelatihan yang disesuaikan untuk pelatihan ini berdasarkan kebutuhan tumpukan aplikasi atau integrasi Anda, silakan hubungi kami untuk mengatur.
Cambricon MLU Development with BANGPy and Neuware
21 JamCambricon MLUs (Machine Learning Unit) adalah chip AI khusus yang dioptimalkan untuk inferensi dan pelatihan dalam skenario edge dan data center.
Pelatihan langsung ini (daring atau di tempat) ditujukan bagi pengembang tingkat menengah yang ingin membangun dan mendeploy model AI menggunakan kerangka kerja BANGPy dan SDK Neuware pada hardware Cambricon MLU.
Selesai pelatihan ini, peserta akan dapat:
- Mengatur dan mengonfigurasi lingkungan pengembangan BANGPy dan Neuware.
- Mengembangkan dan memperbaiki model berbasis Python dan C++ untuk Cambricon MLUs.
- Deploy model ke perangkat edge dan data center yang menjalankan runtime Neuware.
- Mengintegrasikan alur kerja ML dengan fitur percepatan khusus MLU.
Format Kursus
- Lecture interaktif dan diskusi.
- Penggunaan langsung BANGPy dan Neuware untuk pengembangan dan deploy.
- Latihan yang dipandu dengan fokus pada optimasi, integrasi, dan pengujian.
Opsi Kustomisasi Kursus
- Untuk meminta pelatihan khusus berdasarkan model perangkat Cambricon atau kasus penggunaan Anda, silakan hubungi kami untuk mengatur.
Pengantar CANN untuk Pengembang Kerangka AI
7 JamCANN (Compute Architecture for Neural Networks) adalah kit peralatan komputasi AI Huawei yang digunakan untuk mengompilasi, mengoptimalkan, dan mendistribusikan model AI pada pemroses AI Ascend.
Pelatihan ini yang dipimpin instruktur (online langsung atau langsung tatap muka) ditujukan untuk pengembang AI tingkat pemula yang ingin memahami bagaimana CANN terintegrasi dalam siklus hidup model dari pelatihan hingga distribusi, dan bagaimana cara kerjanya dengan kerangka seperti MindSpore, TensorFlow, dan PyTorch.
Di akhir pelatihan ini, peserta akan dapat:
- Memahami tujuan dan arsitektur dari kit peralatan CANN.
- Menyiapkan lingkungan pengembangan dengan CANN dan MindSpore.
- Mengonversi dan mendistribusikan model AI sederhana ke perangkat keras Ascend.
- Mendapatkan pengetahuan dasar untuk proyek optimasi atau integrasi CANN di masa depan.
Format Kursus
- Kuliah interaktif dan diskusi.
- Latihan praktis dengan distribusi model sederhana.
- Panduan langkah demi langkah dari rantai alat CANN dan titik integrasi.
Opsi Pemasaran Kursus
- Untuk meminta pelatihan khusus untuk kursus ini, silakan hubungi kami untuk menyusun.
CANN untuk Edge AI Deployment
14 JamKit alat Ascend CANN dari Huawei memungkinkan inferensi AI yang kuat pada perangkat edge seperti Ascend 310. CANN menyediakan alat-alat penting untuk mengompilasi, mengoptimalkan, dan mendepatkan model di mana komputasi dan memori terbatas.
Pelatihan langsung ini (online langsung atau pelatihan langsung tatap muka) ditujukan untuk pengembang AI dan integrator tingkat menengah yang ingin mendepatkan dan mengoptimalkan model pada perangkat edge Ascend menggunakan rantai alat CANN.
Di akhir pelatihan ini, peserta akan dapat:
- Menyiapkan dan mengkonversi model AI untuk Ascend 310 menggunakan alat CANN.
- Membangun pipa inferensi ringan menggunakan MindSpore Lite dan AscendCL.
- Mengoptimalkan kinerja model untuk lingkungan komputasi dan memori terbatas.
- Mendepatkan dan memantau aplikasi AI dalam kasus penggunaan edge dunia nyata.
Format Kursus
- Presentasi interaktif dan demonstrasi.
- Pekerjaan laboratorium tangan dengan model dan skenario spesifik edge.
- Contoh deploy langsung pada perangkat keras edge virtual atau fisik.
Opsi Pemasaran Kursus
- Untuk meminta pelatihan yang disesuaikan untuk kursus ini, silakan hubungi kami untuk menyelenggarakannya.
Memahami Stack Komputasi AI dari Huawei: Dari CANN hingga MindSpore
14 JamStack AI Huawei — dari SDK tingkat rendah CANN hingga kerangka MindSpore tingkat tinggi — menawarkan lingkungan pengembangan dan pelaksanaan AI yang terintegrasi ketat yang dioptimalkan untuk perangkat keras Ascend.
Pelatihan langsung ini (online atau tatap muka) ditujukan untuk profesional teknis tingkat pemula hingga menengah yang ingin memahami bagaimana komponen CANN dan MindSpore bekerja bersama untuk mendukung manajemen siklus hidup AI dan keputusan infrastruktur.
Setelah selesai mengikuti pelatihan ini, peserta akan dapat:
- Memahami arsitektur bertingkat dari stack komputasi AI Huawei.
- Mengidentifikasi bagaimana CANN mendukung optimasi model dan pelaksanaan tingkat perangkat keras.
- Menevaluasi kerangka dan rantai alat MindSpore dalam hubungan dengan alternatif industri.
- Memposisikan stack AI Huawei dalam lingkungan perusahaan atau cloud/on-prem.
Format Kursus
- Kegiatan interaktif dan diskusi.
- Demo sistem langsung dan pemandu kasus.
- Laboratorium terpandu opsional tentang aliran model dari MindSpore ke CANN.
Opsi Kustomisasi Kursus
- Untuk meminta pelatihan kustom untuk kursus ini, silakan hubungi kami untuk mengatur.
Optimizing Neural Network Performance dengan CANN SDK
14 JamCANN SDK (Arsitektur Komputasi untuk Neural Networks) adalah fondasi komputasi AI dari Huawei yang memungkinkan pengembang untuk menyetel dan mengoptimalkan performa jaringan saraf terdistribusi di prosesor AI Ascend.
Pelatihan langsung (online atau offline) ini ditujukan kepada pengembang AI tingkat lanjut dan insinyur sistem yang ingin mengoptimalkan performa inferensi menggunakan alat canggih CANN, termasuk Graph Engine, TIK, dan pengembangan operator kustom.
Setelah selesai pelatihan ini, peserta akan dapat:
- Mengerti arsitektur runtime dan siklus hidup performa dari CANN.
- Menggunakan alat profiling dan Graph Engine untuk analisis dan optimasi performa.
- Menyusun dan mengoptimalkan operator kustom menggunakan TIK dan TVM.
- Membuat solusi bottleneck memori dan meningkatkan throughput model.
Format Kursus
- Diskusi interaktif dan pembicaraan.
- Laboratorium hands-on dengan profil real-time dan penyetelan operator.
- Tugas optimasi menggunakan contoh penerapan kasus tepi.
Pilihan Kustomisasi Kursus
- Untuk meminta pelatihan khusus untuk kursus ini, silakan hubungi kami untuk mengatur.
CANN SDK untuk Computer Vision dan Pipelines NLP
14 JamSDK CANN (Arsitektur Komputasi untuk Neural Networks) menyediakan alat penyebaran dan optimasi yang powerful untuk aplikasi AI secara real-time dalam visi komputer dan NLP, khususnya pada perangkat keras Huawei Ascend.
Pelatihan berorientasi instruktur ini (daring atau tatap muka) ditujukan bagi praktisi AI level menengah yang ingin membangun, menyebarkan, dan mengoptimalkan model visi dan bahasa menggunakan SDK CANN untuk kasus penggunaan produksi.
Selesai pelatihan ini, peserta akan dapat:
- Menyebarkan dan mengoptimalkan model CV dan NLP menggunakan CANN dan AscendCL.
- Menggunakan alat-alat CANN untuk mengonversi model dan mengintegrasikannya ke dalam pipa kerja langsung.
- Memaksimalkan kinerja inferensi untuk tugas seperti deteksi, klasifikasi, dan analisis sentimen.
- Membangun pipa kerja CV/NLP secara real-time untuk skenario penyebaran edge atau berbasis cloud.
Format Kursus
- Kuliah interaktif dan demonstrasi.
- Praktek langsung dengan model penyebaran dan profil kinerja.
- Desain pipa kerja langsung menggunakan kasus penggunaan CV dan NLP nyata.
Opsi Pemaduan Kursus
- Untuk meminta pelatihan yang dipersonalisasi untuk kursus ini, silakan hubungi kami untuk mengatur.
Membuat Operator AI Kustom dengan CANN TIK dan TVM
14 JamCANN TIK (Tensor Instruction Kernel) dan Apache TVM memungkinkan optimasi dan kustomisasi tingkat lanjut untuk operator model AI di Huawei Ascend perangkat keras.
Pelatihan ini yang dikemudikan instruktur (pelatihan online langsung atau pelatihan langsung tatap muka) ditujukan untuk pengembang sistem tingkat lanjut yang ingin membangun, menyebarkan, dan menyesuaikan operator kustom untuk model AI menggunakan model pemrograman TIK dari CANN dan integrasi kompilator TVM.
Di akhir pelatihan ini, peserta akan dapat:
- Menulis dan menguji operator AI kustom menggunakan TIK DSL untuk prosesor Ascend.
- Mengintegrasikan operator kustom ke dalam runtime dan grafik eksekusi CANN.
- Menggunakan TVM untuk penjadwalan operator, penyesuaian otomatis, dan penilaian kinerja.
- Memeriksa dan mengoptimalkan kinerja level instruksi untuk pola komputasi kustom.
Format Pelatihan
- Pertemuan interaktif dan demonstrasi.
- Pengkodean tangan pertama untuk operator menggunakan pipeline TIK dan TVM.
- Pengujian dan penyesuaian di perangkat keras Ascend atau simulasi.
Opsi Kustomisasi Pelatihan
- Untuk meminta pelatihan kustom untuk kursus ini, silakan hubungi kami untuk mengatur.
Migrating CUDA Applications to Chinese GPU Architectures
21 JamArsitektur GPU China seperti Huawei Ascend, Biren, dan Cambricon MLUs menawarkan alternatif CUDA yang disesuaikan untuk pasar AI dan HPC lokal.
Pelatihan langsung ini (daring atau tatap muka) ditujukan bagi programmer tingkat lanjut dan spesialis infrastruktur GPU yang ingin mengalihkan dan memperbaiki aplikasi CUDA yang ada untuk diimplementasikan pada platform perangkat keras China.
Selesai melalui pelatihan ini, peserta akan dapat:
- Mengevaluasi kompatibilitas beban kerja CUDA yang ada dengan alternatif chip China.
- Mengalihkan basis kode CUDA ke lingkungan Huawei CANN, Biren SDK, dan Cambricon BANGPy.
- Membandingkan kinerja dan mengidentifikasi titik optimasi di berbagai platform.
- Mengatasi tantangan praktis dalam dukungan silang-arsitektur dan implementasi.
Bentuk Kursus
- Lektur interaktif dan diskusi.
- Laboratorium praktik alih kode dan perbandingan kinerja.
- Latihan terarah yang fokus pada strategi adaptasi multi-GPU.
Opsi Kustomisasi Kursus
- Untuk meminta pelatihan khusus untuk kursus ini berdasarkan platform atau proyek CUDA Anda, silakan hubungi kami untuk mengatur.