Coconote
AI notes
AI voice & video notes
Try for free
🖼️
Pengantar Convolutional Neural Network (CNN)
Sep 17, 2024
Catatan Kuliah tentang CNN (Convolutional Neural Network)
Pendahuluan
CNN adalah jenis Neural Network yang umum digunakan untuk analisis dan klasifikasi gambar.
Dengan mempelajari CNN, kita dapat mengembangkan berbagai aplikasi dalam Artificial Intelligence dan Machine Learning.
Video ini bertujuan untuk memberikan penjelasan komprehensif tentang CNN dalam durasi sekitar 45 menit.
Proses Awal
Menggunakan gambar berukuran 160 x 160.
Membaca gambar untuk mendapatkan variabel train X dan train Y.
Train X berisi 150 data (50 data untuk masing-masing simbol U, V, W) dengan ukuran 160 x 160 x 3 (RGB).
Proses awal: reading data, flattening, dan transpose.
Flattening
Semua pixel (160 x 160 x 3) dijadikan satu baris, menghasilkan 76.800 pixel.
Proses ini menggabungkan semua pixel menjadi satu dimensi.
Transpose
Pixel yang telah di-flatten diputar dan disusun kembali untuk input ke neural network.
Kesulitan dalam Pembelajaran
Akurasi model masih rendah (sekitar 70%) saat mengklasifikasikan 3 simbol.
Kesulitan muncul karena pixel-pixel tersebar di berbagai lokasi.
Model harus belajar untuk menghubungkan pixel yang relevan.
Konsep Konvolusi
Proses Konvolusi
: Node melihat region-area (misalnya, 3x3, 5x5) daripada semua pixel secara flat.
Dengan konvolusi, fitur dapat dikenali lebih baik dalam gambar.
Penggunaan filter untuk mengidentifikasi fitur dalam gambar.
Proses Konvolusi
Menggunakan filter ukuran 3x3 hingga 7x7.
Filter bertugas mengenali pola dan fitur tertentu dalam gambar.
Output menunjukkan seberapa cocok bagian gambar dengan filter.
Padding dan Stride
Padding
: Menambahkan lapisan di sekitar gambar untuk menjaga ukuran output.
Stride
: Menentukan seberapa banyak pergeseran saat menerapkan filter.
Pooling
Max Pooling
: Mengambil nilai maksimum dari region yang lebih kecil untuk mengurangi ukuran output tanpa mengubah jumlah channel.
Average Pooling
: Mengambil rata-rata dari pixel dalam area yang ditentukan.
Kombinasi Layer
Menggabungkan beberapa layer konvolusi dan pooling untuk mengekstrak fitur dari gambar secara bertahap.
Setiap layer mengekstrak fitur yang lebih kompleks dari layer sebelumnya.
Proses Akhir
Setelah beberapa layer konvolusi dan pooling, hasil output di-flatten ke dalam format yang dapat diproses oleh neural network biasa.
Menggunakan softmax di layer akhir untuk klasifikasi.
Kesimpulan
CNN memberikan pendekatan yang lebih efektif dalam mengenali dan memahami gambar.
Dengan banyaknya layer, CNN dapat mengekstrak fitur yang lebih kompleks.
Pada video berikutnya, akan ada demonstrasi pemrograman CNN untuk klasifikasi gambar.
📄
Full transcript