Coconote
AI notes
AI voice & video notes
Try for free
Vision Intelligence dalam Teknologi Kecerdasan Buatan
Jul 9, 2024
Vision Intelligence dalam Teknologi Kecerdasan Buatan
Pengantar
Pembicara:
Dr. Muhammad Iqbal (Kepala Program Studi D3 Teknik Komputer), Dr. Sigit Widianto
Topik:
Vision Intelligence β Pengumpulan, analisis, dan pemahaman gambar, video digital, dan implementasi AI dalam machine vision.
Sistem Vision dan Anatomi Computer Vision
Mengapa Vision Intelligence Penting?
Penglihatan Manusia dan Hewan:
Studi tentang mekanisme penglihatan untuk meniru kecerdasan visual manusia/hewan.
Resolusi Mata Manusia:
576 megapiksel; efektif dalam menyimpan hanya data yang penting.
Cortex Visual Manusia:
50% otak manusia berkaitan dengan penglihatan.
Proses Penglihatan Manusia
Ilusi Otak:
Otak menciptakan ilusi berdasarkan emosi dan fisiologi (contoh: Adelson Checkerboard, Ilusi Davidoff).
Persepsi:
Berbeda tergantung keadaan manusia (kenyang vs. lapar).
Teknologi Computer Vision
Konsep:
Komputer mengubah citra atau video digital menjadi data yang dapat dianalisis dan dipahami.
Research Quote:
βTo make a machine think, teach it to see.β
Kecerdasan Visual:
Mata sebagai alat optik, informasi diolah di otak untuk menghasilkan persepsi.
Komputer Vision:
Meningkatkan kemampuan komputer untuk mengumpulkan, menganalisis, dan memahami citra atau video.
Bidang Ilmu Terkait
Interdisipliner:
Machine vision, image processing, neurobiologi, fisika, signal processing.
Pendekatan:
Imaging (spasial X-Y) dan signal processing (gelombang elektromagnetik).
Aplikasi:
Robotics, artificial intelligence, machine learning, matematika.
Anatomi Machine Vision
Implementasi:
Dari pengambilan gambar hingga analisis dan hasil akhir.
Proses:
Pengambilan gambar (target dengan kamera), pencahayaan, preprocessing, extract fitur, diferensiasi, dan keluaran.
**Tingkat Pengolahan Citra: (Level 0-3) mengubah gambar menjadi informasi yang dapat digunakan komputer.
Level Pengolahan Citra
Level 0 (Akuisisi Citra):
Representasi, sampling, kuantisasi, kompresi.
Level 1 (Transformasi Gambar):
Enhancement, restoration, segmentation.
Level 2 (Transformasi Gambar ke Parameter):
Feature selection, object recognition.
Level 3 (Parameter ke Decision):
Decision making based on identified objects.
Tahapan Pengolahan Citra
Image Acquisition:
Mengambil gambar dengan kamera, proses digitalisasi
Image Enhancement:
Menghilangkan noise, memperjelas fitur.
Image Restoration:
Mengetahui ketidaksempurnaan gambar dan memperbaikinya.
Morphological Processing:
Mengambil feature dari gambar dan mendeskripsikannya.
Segmentation:
Memisahkan objek foreground dari background.
Object Recognition:
Mengidentifikasi objek dalam gambar.
Representation, Compression, Processing:
Meningkatkan kualitas gambar agar mudah dibaca oleh manusia atau sistem.
Tools dan Library untuk Computer Vision
Beberapa Tools:
Halcon, Cognex, OpenCV
Catatan Penting:
Lighting, staging, lenses, camera penting dalam anatomis computer vision.
Implementasi AI dalam Machine Vision
Pengenalan Machine Learning (ML) dan Deep Learning (DL):
Machine Learning: Feature extraction, classification (SVM, decision tree).
Deep Learning: CNN (Convolutional Neural Network), shape-based feature modeling.
AI dalam Video Surveillance
Machine Learning vs. Deep Learning:
Fungsi, feature extraction, klasifikasi, konvolusi.
Generative AI:
Menghasilkan konten visual secara mandiri (descriptive, zero-shot classification, text-to-vision).
Implementasi AI di Berbagai Bidang
Autonomous Vehicle
Face Recognition
Medical Imaging:
Cancer detection
Traffic Monitoring
Retail Management
Tantangan dan Permasalahan AI dalam Vision Intelligence
Data Volume dan Variability:
Transfer learning untuk penggunaan data.
Kinerja dan Kecepatan:
Penggunaan GPU, TensorFlow untuk optimalisasi.
Etika dan Keamanan Data:
HTTPS dan PDP.
Blackbox Nature:
Mempelajari dan memahami prediksi box modeling.
Penutup
Pentingnya AI:
Alat bantu untuk manusia, perkembangan teknologi membawa banyak manfaat.
Peran Mahasiswa:
Potensi penelitian di bidang image processing, computer vision, machine learning, dan AI.
π
Full transcript