Kursus Pelatihan SMACK Stack untuk Data Science
SMACK adalah sebuah koleksi perangkat lunak platform data, yaitu Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra, dan Apache Kafka. Dengan menggunakan SMACK stack, pengguna dapat membuat dan menskalakan platform pemrosesan data.
Pelatihan ini, yang dibimbing oleh instruktur (pelatihan online langsung atau pelatihan langsung tatap muka), ditujukan untuk para ilmuwan data yang ingin menggunakan SMACK stack untuk membangun platform pemrosesan data untuk solusi big data.
Setelah selesai mengikuti pelatihan ini, peserta akan mampu:
- Mengimplementasikan arsitektur pipa data untuk memproses big data.
- Mengembangkan infrastruktur cluster dengan Apache Mesos dan Docker.
- Menganalisis data dengan Spark dan Scala.
- Mengelola data tidak terstruktur dengan Apache Cassandra.
Format Pelatihan
- Pembahasan interaktif dan diskusi.
- Banyak latihan dan praktik.
- Implementasi langsung di lingkungan lab langsung.
Opsi Kustomisasi Pelatihan
- Untuk meminta pelatihan kustom untuk pelatihan ini, silakan hubungi kami untuk menyelenggarakannya.
Kerangka Materi
Pengenalan
Tinjauan SMACK Stack
- Apa itu Apache Spark? Fitur Apache Spark
- Apa itu Apache Mesos? Fitur Apache Mesos
- Apa itu Apache Akka? Fitur Apache Akka
- Apa itu Apache Cassandra? Fitur Apache Cassandra
- Apa itu Apache Kafka? Fitur Apache Kafka
Bahasa Scala
- Sintaksis dan struktur Scala
- Alur kontrol Scala
Persiapan Lingkungan Pengembangan
- Menginstal dan mengkonfigurasi SMACK stack
- Menginstal dan mengkonfigurasi Docker
Apache Akka
- Menggunakan aktor
Apache Cassandra
- Membuat basis data untuk operasi pembacaan
- Bekerja dengan cadangan dan pemulihan
Konnector
- Membuat aliran data
- Membangun aplikasi Akka
- Menyimpan data dengan Cassandra
- Merekamen konnector
Apache Kafka
- Bekerja dengan kluster
- Membuat, menerbitkan, dan mengkonsumsi pesan
Apache Mesos
- Mengalokasikan sumber daya
- Menjalankan kluster
- Bekerja dengan Apache Aurora dan Docker
- Menjalankan layanan dan pekerjaan
- Mengimplementasikan Spark, Cassandra, dan Kafka pada Mesos
Apache Spark
- Mengelola aliran data
- Bekerja dengan RDD dan dataframes
- Melakukan analisis data
Penyelesaian Masalah
- Menanganani kegagalan layanan dan kesalahan
Ringkasan dan Kesimpulan
Persyaratan
- Pengertian tentang sistem pengolahan data
Target Peserta
- Data Scientists
Kursus Pelatihan Terbuka membutuhkan minimal 5 peserta.
Kursus Pelatihan SMACK Stack untuk Data Science - Pemesanan
Kursus Pelatihan SMACK Stack untuk Data Science - Penyelidikan
SMACK Stack untuk Data Science - Permintaan Konsultasi
Testimoni (1)
sangat interaktif...
Richard Langford
Kursus - SMACK Stack for Data Science
Diterjemahkan Mesin
Kursus Mendatang
Kursus Terkait
Anaconda Ecosystem for Data Scientists
14 JamPelatihan langsung yang dipimpin instruktur di Indonesia (online atau di tempat) ini ditujukan untuk ilmuwan data yang ingin menggunakan ekosistem Anaconda untuk menangkap, mengelola, dan menyebarkan paket dan alur kerja analisis data dalam satu platform.
Pada akhir pelatihan ini, peserta akan dapat:
- Instal dan konfigurasikan Anaconda komponen dan pustaka.
- Memahami konsep inti, fitur, dan manfaat Anaconda.
- Kelola paket, lingkungan, dan saluran menggunakan Anaconda Navigator.
- Gunakan paket Conda, R, dan Python untuk ilmu data dan pembelajaran mesin.
- Ketahui beberapa kasus penggunaan praktis dan teknik untuk mengelola berbagai lingkungan data.
Pendahuluan Praktis tentang Ilmu Data
35 JamPeserta yang menyelesaikan pelatihan ini akan mendapatkan pemahaman praktis dan nyata tentang Ilmu Data serta teknologi, metodologi, dan alat terkaitnya.
Peserta akan memiliki kesempatan untuk menerapkan pengetahuan ini melalui latihan praktis. Interaksi kelompok dan umpan balik instruktur merupakan komponen penting dari kelas ini.
Kursus dimulai dengan pengenalan konsep dasar Ilmu Data, kemudian beralih ke alat dan metodologi yang digunakan dalam Ilmu Data.
Audience
- Pengembang
- Analis Teknis
- Konsultan IT
Format Kursus
- Sebagian ceramah, sebagian diskusi, latihan dan praktik langsung yang intensif
Catatan
- Untuk meminta pelatihan yang disesuaikan untuk kursus ini, silakan hubungi kami untuk mengatur.
Programme Ilmu Data
245 JamLedakan informasi dan data di dunia saat ini tak terbandingkan, kemampuan kita untuk inovasi dan mendorong batas-batas kemungkinan semakin cepat dari sebelumnya. Peran Data Scientist adalah salah satu keterampilan paling dicari di industri saat ini.
Kami menawarkan lebih dari sekedar belajar melalui teori; kami menyampaikan keterampilan praktis dan terpasar yang menutupi celah antara dunia akademisi dan permintaan industri.
Kurikulum 7 minggu ini dapat disesuaikan dengan kebutuhan industri Anda tertentu, silakan hubungi kami untuk informasi lebih lanjut atau kunjungi website Institute Nobleprog.
Peserta:
Program ini ditujukan bagi lulusan tingkat sarjana serta siapa saja yang memiliki keterampilan persyaratan yang diperlukan yang akan ditentukan melalui penilaian dan wawancara.
Pengiriman:
Pengiriman kursus akan mencakup campuran Pelatihan Kelas Tatap Muka Berbimbing Dosen dan Pelatihan Online Berbimbing Dosen; biasanya minggu pertama akan 'dibimbing kelas', minggu 2 - 6 'kelas maya' dan minggu 7 kembali ke 'dibimbing kelas'.
Ilmu Data untuk Analisis Big Data
35 JamBig data adalah data set yang sangat besar dan rumit sehingga perangkat lunak aplikasi pemrosesan data tradisional tidak memadai untuk mengatasi mereka. Tantangan big data meliputi penangkapan data, penyimpanan data, analisis data, pencarian, pembagian, transfer, visualisasi, penelitian, pembaruan dan privasi informasi.
Ilmu Data untuk Profesi Marketing/Sales
21 Jam
Kursus ini ditujukan untuk Profesional Marketing Sales yang berencana untuk lebih mendalami penerapan data science dalam Marketing/Sales. Kursus ini menyediakan
cakupan rinci tentang berbagai teknik data science yang digunakan untuk “upsale”, “cross-sale”, segmentasi pasar, branding dan CLV.
Perbedaan Marketing dan Sales - Bagaimana sales dan marketing itu berbeda?
Dalam kata-kata yang sangat sederhana, penjualan dapat diartikan sebagai proses yang fokus atau bertujuan pada individu atau kelompok kecil. Marketing di sisi lain menargetkan kelompok yang lebih besar atau publik umum. Marketing termasuk penelitian (identifikasi kebutuhan pelanggan), pengembangan produk (menghasilkan produk inovatif) dan promosi produk (melalui iklan) serta menciptakan kesadaran tentang produk di kalangan konsumen. Dengan demikian, marketing berarti menghasilkan leads atau prospek. Setelah produk dipasarkan, tugas orang penjualan adalah meyakinkan pelanggan untuk membeli produk tersebut. Penjualan berarti mengubah leads atau prospek menjadi pembelian dan pesanan, sementara marketing bertujuan jangka panjang, sedangkan penjualan berkaitan dengan tujuan jangka pendek.
Jupyter untuk Tim Data Science
7 JamPelatihan berorientasi instruktur langsung ini di Indonesia (daring atau tatap muka) memperkenalkan ide pengembangan kolaboratif dalam sains data dan mendemonstrasikan bagaimana menggunakan Jupyter untuk melacak dan berpartisipasi sebagai tim dalam "hidup komputasional". Pelatihan ini membimbing peserta melalui pembuatan proyek sains data contoh yang didasarkan pada ekosistem Jupyter.
Selesai pelatihan ini, peserta akan dapat:
- Instal dan konfigurasikan Jupyter, termasuk pembuatan dan integrasi repositori tim di Git.
- Menggunakan fitur-fitur Jupyter seperti ekstensi, widget interaktif, mode multiuser, dan lainnya untuk memungkinkan kolaborasi proyek.
- Membuat, berbagi, dan mengorganisir Jupyter Notebook dengan anggota tim.
- Memilih dari Scala, Python, R, untuk menulis dan menjalankan kode terhadap sistem data besar seperti Apache Spark, semua melalui antarmuka Jupyter.
Kaggle
14 JamPelatihan langsung yang dipimpin instruktur di Indonesia (online atau di tempat) ini ditujukan untuk ilmuwan data dan pengembang yang ingin belajar dan membangun karier mereka di Data Science menggunakan Kaggle.
Pada akhir pelatihan ini, peserta akan dapat:
- Pelajari tentang ilmu data dan pembelajaran mesin.
- Jelajahi analitik data.
- Pelajari tentang Kaggle dan cara kerjanya.
MATLAB Dasar, Ilmu Data, dan Penggenerasian Laporan
35 JamPada bagian pertama pelatihan ini, kami membahas dasar-dasar MATLAB dan fungsinya sebagai bahasa dan platform. Termasuk dalam diskusi ini adalah pengenalan MATLAB sintaksis, array dan matriks, visualisasi data, pengembangan skrip, dan prinsip-prinsip berorientasi objek.
Di bagian kedua, kami mendemonstrasikan cara menggunakan MATLAB untuk penambangan data, pembelajaran mesin, dan analisis prediktif. Untuk memberikan peserta perspektif yang jelas dan praktis tentang pendekatan dan kekuatan MATLAB, kami membuat perbandingan antara penggunaan MATLAB dan penggunaan alat lain seperti spreadsheet, C, C++, dan Visual Basic.
Pada bagian ketiga pelatihan, peserta belajar bagaimana menyederhanakan pekerjaan mereka dengan mengotomatiskan pemrosesan data dan pembuatan laporan.
Sepanjang kursus, peserta akan mempraktikkan ide-ide yang dipelajari melalui latihan langsung di lingkungan laboratorium. Di akhir pelatihan, peserta akan memiliki pemahaman menyeluruh tentang kemampuan MATLAB dan akan dapat menggunakannya untuk memecahkan masalah ilmu data di dunia nyata serta menyederhanakan pekerjaan mereka melalui otomatisasi.
Penilaian akan dilakukan sepanjang kursus untuk mengukur kemajuan.
Format Kursus
- Kursus mencakup latihan teoretis dan praktis, termasuk diskusi kasus, pemeriksaan kode sampel, dan implementasi langsung.
Catatan
- Sesi latihan akan didasarkan pada contoh templat laporan data yang telah diatur sebelumnya. Jika Anda memiliki persyaratan khusus, silakan hubungi kami untuk mengaturnya.
Machine Learning untuk Data Science dengan Python
21 JamPelatihan langsung yang dipimpin instruktur di Indonesia (daring atau tatap muka) ini ditujukan untuk analis data tingkat menengah, pengembang, atau calon ilmuwan data yang ingin menerapkan teknik pembelajaran mesin dalam Python untuk mengungkap wawasan, membuat prediksi, dan mempercepat keputusan berbasis data.
Selesai menjalani kursus ini, peserta akan dapat:
- Mengerti dan membedakan paradigma pembelajaran mesin utama.
- Mengeksplorasi teknik pra-pemrosesan data dan metrik evaluasi model.
- Menerapkan algoritma pembelajaran mesin untuk menyelesaikan masalah data dunia nyata.
- Menggunakan perpustakaan Python dan Jupyter notebooks untuk pengembangan praktis.
- Membangun model untuk prediksi, klasifikasi, rekomendasi, dan klastering.
Mempercepat Alur Kerja Python Pandas dengan Modin
14 JamPelatihan langsung yang dipimpin instruktur di Indonesia (online atau di tempat) ini ditujukan untuk ilmuwan data dan pengembang yang ingin menggunakan Modin untuk membangun dan menerapkan komputasi paralel dengan Pandas untuk analisis data yang lebih cepat.
Pada akhir pelatihan ini, peserta akan dapat:
- Siapkan lingkungan yang diperlukan untuk mulai mengembangkan Pandas alur kerja berskala dengan Modin.
- Memahami fitur, arsitektur, dan keuntungan Modin.
- Ketahui perbedaan antara Modin, Dask, dan Ray.
- Lakukan operasi Pandas lebih cepat dengan Modin.
- Terapkan seluruh API dan fungsi Pandas.
Python dan Spark untuk Big Data di Perbankan (PySpark)
14 JamPython adalah bahasa pemrograman tingkat tinggi yang terkenal dengan sintaksnya yang jelas dan keterbacaan kode. Spark adalah mesin pengolahan data yang digunakan dalam pengecekan, analisis, dan transformasi big data. PySpark memungkinkan pengguna untuk mengintegrasikan Spark dengan Python.
Target Audience: Profesional tingkat menengah di industri perbankan yang familiar dengan Python dan Spark, berkeinginan untuk mendalami keterampilan mereka dalam pengolahan big data dan pembelajaran mesin.
Python Programming for Finance
35 JamPython adalah bahasa pemrograman yang telah mendapatkan popularitas besar di industri keuangan. Diadopsi oleh bank investasi dan hedge fund terbesar, bahasa ini digunakan untuk membangun berbagai aplikasi keuangan mulai dari program perdagangan inti hingga sistem manajemen risiko.
Dalam pelatihan langsung yang dipimpin oleh instruktur ini, peserta akan mempelajari cara menggunakan Python untuk mengembangkan aplikasi praktis untuk memecahkan sejumlah masalah terkait keuangan tertentu.
Pada akhir pelatihan ini, peserta akan dapat:
- Memahami dasar-dasar bahasa pemrograman Python
- Mengunduh, memasang, dan memelihara alat pengembangan terbaik untuk membuat aplikasi keuangan di Python
- Memilih dan menggunakan paket dan teknik pemrograman Python yang paling sesuai untuk mengatur, memvisualisasikan, dan menganalisis data keuangan dari berbagai sumber (CSV, Excel, database, web, dll.)
- Membangun aplikasi yang memecahkan masalah terkait alokasi aset, analisis risiko, kinerja investasi, dan lainnya
- Memecahkan masalah, mengintegrasikan, menerapkan, dan mengoptimalkan aplikasi Python
Target Peserta
- Pengembang
- Analis
- Quant
Format Kursus
- Sebagian kuliah, sebagian diskusi, latihan, dan praktik langsung yang intensif
Catatan
- Pelatihan ini bertujuan untuk memberikan solusi untuk beberapa masalah utama yang dihadapi oleh para profesional keuangan. Namun, jika Anda memiliki topik, alat, atau teknik tertentu yang ingin Anda tambahkan atau elaborasi lebih lanjut, silakan hubungi kami untuk mengatur.
GPU Data Science dengan NVIDIA RAPIDS
14 JamPelatihan ini yang dilaksanakan oleh instruktur dalam format Indonesia (pelatihan online langsung atau pelatihan langsung tatap muka) ditujukan untuk ilmuwan data dan pengembang yang ingin menggunakan RAPIDS untuk membangun pipa data, workflow, dan visualisasi yang dioptimalkan dengan GPU, menerapkan algoritma machine learning seperti XGBoost, cuML, dan lain-lain.
Setelah menyelesaikan pelatihan ini, peserta akan mampu untuk:
- Menyiapkan lingkungan pengembangan yang diperlukan untuk membangun model data dengan NVIDIA RAPIDS.
- Memahami fitur, komponen, dan keunggulan RAPIDS.
- Menggunakan GPU untuk mempercepat pipa data dan analitik end-to-end.
- Mengimplementasikan persiapan data dan ETL yang dioptimalkan dengan GPU dengan cuDF dan Apache Arrow.
- Belajar mengelola tugas machine learning dengan algoritma XGBoost dan cuML.
- Membangun visualisasi data dan menjalankan analisis grafik dengan cuXfilter dan cuGraph.
Python dan Spark untuk Big Data (PySpark)
21 JamDalam pelatihan langsung yang dipimpin instruktur di Indonesia ini, peserta akan mempelajari cara menggunakan Python dan Spark bersama-sama untuk menganalisis data besar saat mereka mengerjakan latihan langsung.
Pada akhir pelatihan ini, peserta akan mampu:
- Pelajari cara menggunakan Spark dengan Python untuk menganalisis Big Data.
- Kerjakan latihan yang meniru kasus dunia nyata.
- Gunakan alat dan teknik yang berbeda untuk analisis data besar menggunakan PySpark.
Stratio: Modul Rocket dan Intelligence dengan PySpark
14 JamStratio adalah platform yang berorientasi data, yang mengintegrasikan big data, AI, dan governance menjadi satu solusi. Modul Rocket dan Intelligence-nya memungkinkan penjelajahan data cepat, transformasi, dan analitik lanjutan dalam lingkungan enterprise.
Pelatihan langsung (daring atau tatap muka) ini ditujukan untuk profesional data tingkat menengah yang ingin menggunakan modul Rocket dan Intelligence di Stratio dengan efektif bersama PySpark, fokus pada struktur pengulangan, fungsi definisi pengguna, dan logika data lanjutan.
Pada akhir pelatihan ini, peserta akan dapat:
- Menavigasi dan bekerja dalam platform Stratio menggunakan modul Rocket dan Intelligence.
- Mengaplikasikan PySpark dalam konteks penyerapan data, transformasi, dan analisis.
- Menggunakan loop dan logika kondisional untuk mengontrol alur kerja data dan tugas pemrosesan fitur.
- Membuat dan mengelola fungsi definisi pengguna (UDFs) untuk operasi data yang dapat didaur ulang dalam PySpark.
Format Kursus
- Diskusi dan kuliah interaktif.
- Banyak latihan dan praktik.
- Implementasi hands-on dalam lingkungan laboratorium langsung.
Opsi Penyesuaian Kursus
- Untuk meminta pelatihan yang disesuaikan untuk kursus ini, silakan hubungi kami untuk mengatur.