Transcript for:
Pengantar Support Vector Machine (SVM)

Halo semuanya, saya Fida Mastrika. Dalam video sharing kali ini, saya akan menjelaskan tentang materi Support Vector Machine. Pada video kali ini, saya akan menekankan tentang pengertian Support Vector Machine dan bagaimana cara Support Vector Machine dalam kalimat-kalimat sederhana. Oke, kita langsung saja ke materi. Support Vector Machine adalah termasuk metode Supervised Machine Learning yang menggunakan algoritma klasifikasi untuk problem klasifikasi yang memisahkan. dua kelas nah ini adalah support vector machine yang paling sederhana ya nanti support vector machine pun bisa mengklasifikasi lebih dari dua kelas ya prinsip dasar dari SVM ini adalah linia linear classifier Nah kita ingat lagi kalau ketemu dengan kata linear itu berarti ada garis lurus kita bayangkan data kita itu ada di ruang dua dimensi data kita misalnya digambarkan dengan koordinat dari titik-titik tertentu seperti ini ya misalnya data-datanya untuk linear classifier berarti satu garis bisa memisahkan dua data ya misalnya seperti ini nah seperti itu dikembangkan agar dapat bekerja juga pada problem nonlinear gimana kalau problem nonlinear berarti tidak bisa hanya di pisahkan dengan satu garis lurus yang sederhana ini ya Bagaimana dengan yang non-linear? Nanti yang non-linear ini punya konsep namanya konsep kernel trick. Nah, ini untuk ruang kerja yang berdimensi tinggi. Oke, itu dia support vector machine. Dia adalah supervised machine learning dan dia pada prinsip dasarnya adalah sebuah linear classifier. Nah ini yang sudah saya jelaskan tadi setiap item atau setiap data itu diplot sebagai titik dalam ruang n dimensi kalau yang tadi itu kita memplotnya dalam ruang 2 dimensi dimana n adalah sejumlah fitur yang dimiliki Oke kalau tadi di dua dimensi berarti fiturnya ada dua ya kalau misalnya fiturnya ada lima berarti nanti dipetakan dalam ruang lima dimensi juga ya kemudian dilakukan klasifikasi dengan mencari hyperplane yang membedakan kedua kelas dengan baik berarti yang sudah saya jelaskan tadi garis biru yang saya tarik tadi itu nanti akan kita sebut dengan hyperplane ya Tujuan dari algoritma support vector machine adalah menemukan hyperplane dalam ruang n dimensi yang secara jelas mengklasifikasikan titik data. Oke, jadi support vector machine tujuannya adalah menemukan hyperplane yang nantinya akan berbentuk garis ya, yang dapat memisahkan data dengan baik. Oke. Nah, apa yang dimaksud dengan hyperplane? Nah, ini tadi sudah saya jelaskan dengan singkat ya. Coba saya gambar lagi di sini. Oke, kita punya data. Data yang tersebar seperti ini. Saya sudah bedakan dengan warnanya, yang kuning dan yang merah muda. Oke, nah disini kita bisa memisahkan data-data berikut dengan garis ya. Nah bagaimana caranya kita memisahkan apakah dengan garis yang biru, apakah dengan garis yang hitam, atau dengan garis yang merah muda. Oke, ada tiga garis di situ, ada garis biru, ada garis hitam, ada garis yang merah muda. Nah, kira-kira coba kalian tebak-tebak dulu garis mana sih yang sebenarnya memisahkan kedua data ini dengan baik, dan apa alasannya? Apa semua garis ini bisa kita gunakan, atau hanya salah satunya saja nanti yang kita ambil? Oke. Untuk memisahkan kedua kelas titik pada data tersebut, terdapat banyak kemungkinan hyperplane yang dapat dipilih. Ini mirip dengan gambar saya tadi. Jadi ada dua data yang terpisahkan di sini, ada yang warnanya merah, ada yang warnanya ungu, dan garis-garis hijau ini adalah calon dari hyperplane-nya ya. Banyak sekali garis-garis yang bisa digunakan untuk memisahkan kedua data tersebut. Tujuannya adalah menemukan bidang yang memiliki margin maksimum. Garis yang kita buat untuk memisahkan dua data itu harus punya margin yang maksimum, yaitu jarak maksimum antara titik data dari kedua kelas. Oke, berarti jarak garisnya itu harus jauh dari kelas yang satu, dan juga harus jauh dari kelas yang satunya. Coba kita lihat garis yang ini, yang saya ubah warnanya jadi pink ya. Oke, apakah dia jauh dari kelas lingkaran? Jauh, tapi dia dekat dari kelas kota. Berarti ini bukan hyperplane yang maksimal ya, karena jarak maksimalnya ini tidak terpenuhi. Apakah yang ini maksimal juga? Dia jauh dari kelas kota, tetapi dekat dari kelas lingkaran. Berarti bukan maksimal juga. Oke, berarti kita cari yang mana yang marginnya itu paling maksimal. Terima kasih. Oke, seperti inilah gambaran dari sebuah hyperplane yang optimal. Di sini ada batas yang garis putus-putus ini adalah garis bantu untuk membatasi item terluar dari kelas lingkaran. Garis putus-putus yang sebelah sini membantu kita untuk membatasi item terluar dari kelas kota. Jadi kita harus menghitung maksimum margin atau... antara hyperplane dengan garis terluar dari item kota dan kita harus menghitung maksimum margin hyperplane dengan garis bantu terluar dari item lingkaran disanalah kita bisa membuat optimal hyperplanenya jadi kita memaksimalkan jarak margin memberikan beberapa penguatan sehingga titik data uji dapat diklasifikasi dengan baik tidak ada data yang terlalu dekat dengan hyperplane itu jadinya kita bisa mengklasifikasinya dengan baik Ini adalah bentuk dari hyperplane, kalau yang tadi kita gunakan itu dalam dua dimensi, bentuknya adalah sebuah garis. Oke, kalau kita tambahkan lagi dimensinya, ini data yang sama, kita lihat di sebelah sini, di ruang tiga dimensi itu bentuknya adalah sebuah bidang atau plane. Nah ini datanya sama, kita lihat cuma dimensinya saja ditambah ya Bentuknya seperti itu, kalau diproyeksikan Oke, nama metodenya adalah support vector machine ya bukan optimal hyperplane mesin tapi kenapa dari tadi saya hanya membahas tentang optimal hyperplane yang mana sih yang namanya support Vector Oke menurut kalian yang mana namanya support Vector disini dalam SVM objek data terluar, objek data terluar yang paling dekat dengan hyperplane disebut support vector. Oke, kita kembali ke gambar yang tadi, yang mana yang disebut support vector? Objek data terluar katanya, berarti yang lingkaran adalah yang ini, yang kotak adalah yang ini, yang tadi kita gunakan untuk garis bantu untuk membantu kita menentukan maksimal marginnya. Nah, itulah yang namanya. support vector kita kembali ke slide yang tadi oke, objek yang disebut support vector ini paling sulit diklasifikasi karena posisi yang hampir tumpang tindi atau overlap dengan kelas lain karena dia yang paling dekat ya dengan kelas lain makanya itu paling susah diklasifikasi mengingat sifatnya yang kritis hanya support factor inilah yang diperhitungkan untuk menemukan hyperplane yang paling optimal oleh SVM kalau misalnya kita tidak memilih support factor yang bersifat kritis, nanti hyperplanenya bisa eeeem ada di tempat yang salah gitu ya, jadi kita tidak bisa memisahkan dua kelas dengan baik. Makanya kita pilih support factor yang posisinya memang kritis ya, hampir tumpang tindi atau overlap dengan kelas yang lain. Terima kasih. Nah ini contohnya bagaimana caranya kita menggunakan support vector dengan small margin dan large margin. Ini datanya sama ya, di gambar 1 dan gambar 2 itu datanya sama. Yang membedakan adalah kemiringan dari garisnya atau hyperplane yang kita buat. Untuk yang gambar 1 itu hyperplane-nya hampir tegak lurus di sini. Dia memang bisa memisahkan kedua data. tetapi kita lihat juga marginnya harus kita optimalkan ya jadi jarak antara support vector atau garis bantu yang dibentuk oleh support vector ini dengan hyperplane itu harus maksimal bagaimana dimaksimalkan kita bisa lihat di gambar dua contohnya ini ya kita menggunakan support vector ada dua untuk kelas yang biru muda dan ada tiga untuk kelas yang biru tua nah disini kita bisa menemukan kemiringannya ya Oh seperti ini miringnya, dari sini seperti ini miringnya, nah kita buat garisnya dengan memaksimalkan marginnya nah gitu kira-kira cara kerja dari support vector dalam support vector mesin nah tadi datanya linear ya kita bisa memisahkan kedua data tersebut dengan garis, nah bagaimana dengan data yang seperti ini ada kelas segitiga merah dan ada kelas lingkaran dia Nah kalau kalian lihat ini dengan sederhana ya kita bisa aja buat lingkaran di sini. Begini cara memisahkannya oke kelas 1 ini kelas 2 ya bisa seperti itu tapi bagaimana dengan algoritma support vector machine. Oke kita akan menambahkan dimensi ketiga oke ingat hyperplane yang tadi ya kalau di dimensi kedua bagaimana kalau dimensi ketiga. ketiga bagaimana ya, sampai sekarang kita memiliki dua dimensi X dan Y, di gambar tadi kita memiliki dua dimensi X dan Y sekarang kita buat dimensi baru Z yang kita kalkulasikan dengan cara ini, Z sama dengan X kuadrat ditambah Y kuadrat, persamaan ini untuk bentuk lingkaran ya, jadi berapa koordinat titik tersebut atau data tersebut di sumbu X itu dikuadratkan ditambah dengan koordinat koordinat titik tersebut di sumbu y itu dikuadratkan juga jadi seperti apa nanti akan seperti ini loh kok berubah ini dilihat dari sumbu z ya ini dilihat dari sumbu set dan datanya akan seperti ini terlihat Oke dipotong dari sumbu set seperti ini Nah apa yang kita lakukan kita bisa menarik garis ya untuk memisahkan kedua data kita menarik garis kira-kira disitu ya dengan support vector yang ini dan yang itu nah kira-kira seperti itu nah itu dia base hyperplane nya tapi ini dari sumbu set ya ini dari dimensi ketiga kalau kita potong lagi di sumbu X dan Y itu terlihat seperti lingkaran bias hyperplanenya akan terlihat seperti lingkaran dari sudut pandang yang berbeda oke itu dia secara sederhana bagaimana support Vector machine itu bekerja pada data linear dan pada data yang non-linear. Kalau di non-linear itu sederhananya kita harus menambah satu dimensi lagi setelah itu kita cari-cari di mana best hyperplane-nya. Untuk selanjutnya, ini adalah persamaan sederhana dari bagaimana caranya kita melambangkan kelas dan garis yang nantinya kita pakai untuk menghitung dalam suku. support vector machine di sini ada dua kelas yang dipisahkan dan support vector machine nya linear ya karena yang dipakai adalah pembatasnya garis dan pada dua dimensi kelas yang pertama adalah kelas min 1 disini kelas min 1 bentuknya adalah kota dan kelas plus 1 bentuknya adalah lingkaran ya base hyperplane ada di tengah Persamaan garisnya adalah WXI ditambah B sama dengan 0. Nah, support vector dari kelas kotak ada 2. Dan di sini ada garis bantunya ya. Garis bantunya, persamaannya adalah WXI tambah B sama dengan minus 1 sesuai dengan kelasnya ini ya setelah itu garis bantu untuk kelas lingkaran adalah WXI tambah B sama dengan plus 1 jadi data-data yang ada di seberang garis ini ya, di seberang garis hyperplane ini semua pasti nilainya lebih dari 1 ya, yang ada di seberang sini dari hyperplane data-datanya pasti semua ini kurang dari min 1, ya persamaan garisnya adalah ini wxi tambah b sama dengan 0 marginnya adalah 1 per w Oke, itu dia istilah-istilahnya, nanti akan saya jelaskan di video selanjutnya ya. Nah bagaimana materi tentang support vector machine kali ini? Semoga bisa kalian terima dengan baik ya. Lanjutan tentang support vector machine videonya sudah saya sediakan di description box di bawah. Diklik ya. Sampai ketemu di video selanjutnya. Bye.