🖼️

Pengantar Convolutional Neural Network (CNN)

Sep 17, 2024

Catatan Kuliah tentang CNN (Convolutional Neural Network)

Pendahuluan

  • CNN adalah jenis Neural Network yang umum digunakan untuk analisis dan klasifikasi gambar.
  • Dengan mempelajari CNN, kita dapat mengembangkan berbagai aplikasi dalam Artificial Intelligence dan Machine Learning.
  • Video ini bertujuan untuk memberikan penjelasan komprehensif tentang CNN dalam durasi sekitar 45 menit.

Proses Awal

  • Menggunakan gambar berukuran 160 x 160.
  • Membaca gambar untuk mendapatkan variabel train X dan train Y.
  • Train X berisi 150 data (50 data untuk masing-masing simbol U, V, W) dengan ukuran 160 x 160 x 3 (RGB).
  • Proses awal: reading data, flattening, dan transpose.

Flattening

  • Semua pixel (160 x 160 x 3) dijadikan satu baris, menghasilkan 76.800 pixel.
  • Proses ini menggabungkan semua pixel menjadi satu dimensi.

Transpose

  • Pixel yang telah di-flatten diputar dan disusun kembali untuk input ke neural network.

Kesulitan dalam Pembelajaran

  • Akurasi model masih rendah (sekitar 70%) saat mengklasifikasikan 3 simbol.
  • Kesulitan muncul karena pixel-pixel tersebar di berbagai lokasi.
  • Model harus belajar untuk menghubungkan pixel yang relevan.

Konsep Konvolusi

  • Proses Konvolusi: Node melihat region-area (misalnya, 3x3, 5x5) daripada semua pixel secara flat.
  • Dengan konvolusi, fitur dapat dikenali lebih baik dalam gambar.
  • Penggunaan filter untuk mengidentifikasi fitur dalam gambar.

Proses Konvolusi

  • Menggunakan filter ukuran 3x3 hingga 7x7.
  • Filter bertugas mengenali pola dan fitur tertentu dalam gambar.
  • Output menunjukkan seberapa cocok bagian gambar dengan filter.

Padding dan Stride

  • Padding: Menambahkan lapisan di sekitar gambar untuk menjaga ukuran output.
  • Stride: Menentukan seberapa banyak pergeseran saat menerapkan filter.

Pooling

  • Max Pooling: Mengambil nilai maksimum dari region yang lebih kecil untuk mengurangi ukuran output tanpa mengubah jumlah channel.
  • Average Pooling: Mengambil rata-rata dari pixel dalam area yang ditentukan.

Kombinasi Layer

  • Menggabungkan beberapa layer konvolusi dan pooling untuk mengekstrak fitur dari gambar secara bertahap.
  • Setiap layer mengekstrak fitur yang lebih kompleks dari layer sebelumnya.

Proses Akhir

  • Setelah beberapa layer konvolusi dan pooling, hasil output di-flatten ke dalam format yang dapat diproses oleh neural network biasa.
  • Menggunakan softmax di layer akhir untuk klasifikasi.

Kesimpulan

  • CNN memberikan pendekatan yang lebih efektif dalam mengenali dan memahami gambar.
  • Dengan banyaknya layer, CNN dapat mengekstrak fitur yang lebih kompleks.
  • Pada video berikutnya, akan ada demonstrasi pemrograman CNN untuk klasifikasi gambar.