Transcript for:
Pengantar Data Mining

Hai Kya Hua halo halo bagi bangsa ya Irwan Saputra Disini saya akan bahas tentang mata kuliah ditambahin ingini pertemuan pertama kita jadi nggak usah terlalu was-was diri karena masih mudah-mudah lah biasa akan kalau misalkan dikasih Contohkan yang Abang ngomong dulu nanti kalau tugas barunya susah gitu itu kan teori kuliah yang benar ya Om materi yang saya akan sampaikan ini adalah materi milik Bapak Romi Satria Wahono Beliau juga ke seorang praktisi data juga kenapa saya enggak pakai materi milik saya ke karena punya beliau ini udah lengkap juga dan buat apa buang-buang waktu untuk membuat materi sendiri mendingan saya lebih baik menjelaskan aja materi yang sudah ada gitu Ini juga sebagai tribute ke terhadap beliau karena beliau juga seorang praktisi yang sudah lama melanglang buana di dalam dunia it kita langsung saja data maining ini tidak adalah biografi dari beliau Hai kalian bisa cek sendiri karena selainnya udah dikirim ke WhatsApp grup kalau ini videonya ditonton oleh halayak umum nanti link materinya minta aja ya dikomentar biar ada kehidupan komentar saya M nah teknik yang dipakai ini adalah data mining konsumen Teknik ini sebenarnya mata apa buku-buku yang hebatnya buku saktinya atau kitab suci dari data mining ya hehehe karena emang ini yang sering dipakai di kampus-kampus gitu cuman kalau mahasiswanya yang Hai terbata-bata dengan bahasa Inggrisnya agak susah juga kalau misalkan mau yang Bahasa Indonesia itu nanti cari data maining klasifikasi dan klasterisasi data itu miliknya dosen dari Universitas Telkom di Hai warnanya biru nan cek aja judulnya itu yang pertama ini klasifikasian klasterisasi data biru gelap lagi tuh milik the doctor Suyanto ya Hai nah ini referensi-referensi juga yang dipakai pada Hai materi ini berita sini nggak usah yang akan kita bahas langsung saya kebagian materinya nah pengantar utama ini yang pertama apa itu pertama ini peran utama dan metode Tomini sejarah dan penopang utama ini Oke yang pertama Kenapa sih ke ini pendahuluannya ya Apa itu data mining sebelum ke situ kita rubah sini dulu nih Kenapa kita butuh maining Karena manusia memproduksi beragam data yang jumlah nukokne sangat besar Kemarin kan ada berita yang Hai apa itu ngejelasin menggambarkan blackpool gitu gambar Beko itu kan Butuh berapa terabyte otakna itu gimana cara mengolahnya itu tuh ya nah terus itu kan banyak banget datanya lo astronomi ya ada bisnis-bisnis misalkan Sekarang kita lagi ada kasus copied by anti tuh itu dalam dunia bisnis pastikan naik turun pasarnya sangat cepat ya dan fluktuasinya sangat tinggi sehingga pada saat kita ngecek datanya itu bagaimana agar membaca datanya lebih cepat Nah itu diperlukan atau maining itu karena data yang masukkan pasti banyak yang tadinya misalkan pasar ini buka ramai terus tutup yang di sana ramai terus tutupnya itu gimana tuh kan datanya banyak tuh nah sehingga kita butuh kalau tetap Mini untuk memproses data tersebut sehingga kita bisa bergerak cepat untuk mengambil keputusan itu fungsinya kita mainin disitu kedokteran kalian ini juga sama Hai gimana caranya kalau misalkan Coffin ini kita bisa cek menggunakan artificial intelegent atau kecerdasan buatan jadi misalkan JNE katakan eh saat ini tenaga medis kurang ya kan untuk mengecek ovina intense Apakah itu bisa menggunakan data yang bisa Apakah itu bisa menggunakan data yang di jadikan apa ya mesin belajar kemudian mesin tersebut atau robot tadi itu bisa Hai ini mau robot atau mau sistem gitu ya Moses sistem tersebut itu bisa mendeteksi Apakah ini orang kena coffeenine atau enggak gitu Nah itu bisa tuh menggunakan artificial intelegent dalam bidang kedokteran terus ekonomi olahraga cuaca financial tuh banyak jadi manusia ini memproduksi berbagai macam data jangankan eh kita serius untuk mengambil data kita lagi nggak serius juga itu data misalnya kita lagi jalan ke keluar lagi Main Mobile Legend itu juga data lagi mau main mobile Legend itu data Bukan maksudnya data kuotanya bukan Artinya kita sedang main mobile Legend itu itu menjadi data-data apa Data sebaran orang yang sering main mobile Legends di daerah Depok daerah Jakarta itu kan kita jadi termasuk bagian data tersebut gitu datanya data buat siapa hidatha Buat perusahaan mobile Legends jadi biar tahu tuh mereka ke Hai yang paling banyak sering main mobile Legends tuh di daerah mana gitu nanti mereka misalkan kasih giveaway atau apa gitu itu kan jadi data buat mereka juga jadi data itu bukan hanya hal-hal yang yang biasa kalau misal mau skripsi kita kumpulin gitu atom c ketemu mukulin data kalau mau skripsi kan nyari ke sekolahan apa segala macam itu itu memang data tapi yang biasa kita sehari-hari juga kita lakukan itu juga data akhirat itu adalah sesuatu yang fakta yang direkam gitu Hai direkam itu ya terserah mulai ekornya Bukit mau pakai cara apa terus dipahami dulu itu dulu pertemuan datanya astronomis loan digital Sky survey ini Meksiko 2140 terabyte overstayers terus nih banyak ya terus ini ada satuan data nih ada kb mb juga by terabyte sekarang kita udah nyampe teraba nih ya harddisk sudah dengan cara baik bahkan katanya flash garing terhebat tapi saya belum pernah beli CD mau juga belum ada terus ada peta B serta baik kalau misalkan kayak YouTube gitu coba bayangin deh itu YouTube 11 detiknya Hai Kan diakses oleh berapa juta orang tuh satu detiknya diakses oleh berapa juta orang dan dalam satu detik berapa banyak channel YouTube yang mengupload video coba itu butuh data berapa banyak ya kalau Facebook itu kan masih ibaratnya kalau dibandingin itu masih kalah jauh lah karena di Facebook itu biasanya kita ngupload status doang tu kan bentuknya TX atau foto itu kan cuman 2mb atau 10mb gitu kalau videonya baru gede tapi kan kalau di YouTube kita pasti nggak upload video kan yang biasanya diatas 50 MB gitu datanya satu video itu kalau misalkan dikali berapa juta orang yang ngaplo dalam sedalam sekaligus gitu Butuh berapa Hai Bapak Yota betul zatami Toyota baik kita gitu ya Nah itu jadi pertemuan tertutup sangat cepat saat ini tuh menggambarkan ya kecepatan pertumbuhan data dalam biologi dan kedokteran juga ini ada 20 atau b of data Wow ini enggak genomics double yfuf banyak banget ya terus perubahan kultur dan perilaku Nah ini nih ya hai kenapa Data itu makin banyak ya karena perubahan kultur dan perilaku kita kalau misalkan tuh orang sering nonton TV sekarang nonton YouTube gitu kan sampai ada salah satu stasiun TV yang mulai turun pamornya karena Yes makin banyak orang yang nonton YouTube gitu Kenapa kok ada beberapa situs tv stasiun tv yang masih profit artinya masih mendapatkan keuntungan banyak gitu Karena kan mereka menyelenggarakan acara untuk orang-orang awam yang enggak pakai YouTube misalkan ada ibu-ibu yang ya ibu-ibu di kampung ya gitu-gitu kan Makanya acaranya acara dangdut azab itu kan pagi azab siang aja sore aja malam dangdutan segera lazim eh eh Hai itu yang biasa yang nonton kayak gitu makanya masih masih ada profitnya kalau yang acara atau stasiun TV yang mengarah atau target pasarnya adalah anak muda itu udah mau ditinggalin Karena anak muda sekarang udah jarang nonton TV nonton YouTube Segala macemnya ada netflix ya walaupun nyari yang gratisan juga nah ini 47000000 Alibaba semua akses bahkan data-data ini semua akses ada yang akses Facebook adanya akses Twitter Pinterest YouTube Google Plus Google + kalau udah tutup sih tuh ya jadi banyak ya banyak sekali orang yang sudah menggunakan akses internet dibandingkan dia Hai apa tadi nonton TV datangnya tsunami data mobil elektronik market ya Hai ini banyak banget ya Yaudah langsung aja Wa drowning in database surfing fortnite kita ini kebanjiran data tapi lapar dalam pengetahuan jadi kita kekurangan pengetahuan kita itu banjir tetapi kurang pengetahuan kita terhadap data tersebut Ya udah tanya banyak Data itu banyak tetapi kita bingung mau diapain datangnya gitu Buat apa juga itu Hai Nah inilah proses data mining karena data itu tadi banyak sehingga kita harus olah Gimana cara mengolahnya ini nih jadi data-datanya itu bisa berbentuk teks bisa berbentuk gambar bisa berbentuk video audio juga bisa Apapun ya bentuk data itu masuk terus diolah oleh machine-learning atau oleh data mining kemudian nanti akan menghasilkan ekstraksi ekstraksi itu artinya keputusan lah ibaratnya atau rekomendasi keputusan dari data tersebut contohnya ginilah yang paling gampang kita ini kalau misalkan mukul Ya itu kan suka ada yang namanya eh apa ya Hai kebimbangan misalkan kuliah jangan ya misalkan gitu kan kita tuh punya rincian kategori kalau kita memutus untuk kulia atau kita memutuskan untuk gak kuliah misalkan Hai kategori kita untuk kuliah adalah Hai saya kuliah Kalau saya kalau cuaca nggak hujan Kalau nggak macet kalau dosennya enggak Killer kalau dosennya tidak menjenuhkan misalkan gitu Nah itu adalah kategori-kategori yang akan membuat kita berangkat kuliah terus kita juga bikin kategori baru saya tidak akan berangkat kuliah Kalau dosennya Killer kalau dosennya menjenuhkan kalau cuaca hujan kalau Jalanan macet gitu terus itu juga bikin kategori lagi saya apa kalau misalkan cuacanya hujan terus tidak macet dosennya Killer tapi tidak menjenuhkan misalkan Hai Nah itu kalian mau kuliah atau enggak Nah itu tuh bisa dijadikan data maining jadi keputusan-keputusan itu tadi kuliah atau tidak Gitu Itu bisa dijadikan untuk keputusan utama ini Jadi kudatama ini ini enggak mesti hal-hal yang sifatnya uh canggih-canggih artifisial intelijen itu enggak yang abang abang aja dulu yang sehari-hari kita biasa untuk lakukan gitu kalau di bidang kedokteran itu kita bisa cek Apakah ini orang kena diabetes atau tidak nantikan itu ada kategorinya gula darahnya tinggi atau tidak misalkan terus apalagi gemuk atau nggak apalah gitu berat badan lingkar perut kayak gitu gitu Nah itu bisa dijadikan tetap maining nanti keputusannya gitu scene terus buat atau sistem tadi itu tadi itu digunakan untuk kalau misalkan dokternya belum datang gitu Nah itu bisa dicek dulu pakai sistem tadi ditanya dulu pasiennya lebar perutnya berapa gitu Terus dicek ke gula darah yang gitu nanti dimasukin ke sistem itu terus diklik nanti akan muncul Tuh sistem tadi akan memunculkan rekomendasi Apakah ini Hai pasiennya diabetes atau tidak Nah itu disebut dengan ekstraksi data dari seri excelsi pengetahuan dari data maining gitu Apa itu data maining disiplin ilmu yang mempelajari metode untuk mengekspor pengetahuan atau menemukan pola dari suatu data yang besar kalau datanya kecil kayak tadi misalkan Apakah saya harus kuliah ataukah tidak itu kan katanya kecil yaitu gausah pake data mah ini maksudnya ga usah Oh untuk bikin rumus pakai algoritma segala macem di otak juga bisa tapi kalau misalkan datanya kayak tadi tuh kalau misalkan diabetes itu kan kemungkinan banyak kategorinya banyak Nah itu bisa pakai data mining ini karena nanti model datanya itu harus di rekam setelah direkam itu baru diolah menggunakan data mining kayak gitu terus baruto Maestro pengetahuan Apa itu ekor pengetahuan tadi itu rekomendasi Apakah diabetes atau tidak berdasarkan dari data yang sudah dealer atau dipelajari dulu oleh tetap mainin menggunakan suatu algoritma tertentu nanti kita tambah algoritmanya atau menemukan pola yaitu Al bola itu toh biasa disebut dengan algoritma juga bisa lah di sini ekstraksi dari data ke pengetahuan data fakta yang terekam dan tidak membawa arti Oh ya tadi udah dibahas di awal ya pengetahuan itu pola rumusan atur atau modal yang muncul dari data pengetahuan ini dia rumusnya udah jelas sifatnya matematis jadi enggak bisa eh melenceng dari rumus tersebut Oh maksudnya gimana maksudnya gini kalau misalkan kita tadi bilang saya mau kuliah terus kalau misalkan cuacanya hujan terus jalanan gak macet ke sini enggak Killer dosennya tidak menjenuhkan misalkan Nah itu tuh ada matematisnya kan maksudnya mathematics itu dalam kalau disini ibaratkan nya dia tuh berlogika akan gitu gak mungkinkan tiba-tiba saya kalau enggak Hujan enggak macet dosennya gak Killer dosennya asyik terus saya nggak kuliah Nah itu bukan pengetahuan itu itulah karena males gitu ya jadi artinya yang namanya pengetahuan disini yaitu harus harus jelas polanya Kalau memang begitu ya harusnya ada Anda Kuliah bukannya anda tidak kuliah atau makan lah males berarti bukan karena pengetahuan itu beda urusannya gitu nama lain tetap mainin ada Nauli Discovery ndak times nol extension pada analisis information harvesting Intelijen Ya tapi biasanya bisa yang biasa digunakan itulah data maining Apa itu domain ini masih termasuk kedalam objek remaining ya himpunan data Terus adik jadi ada himpunan data yang biasa disebut dengan dataset batasnya itu bisa banyak terus metode tambah ini metode training ini banyak ada klasterisasi ada Asus ya Ada prediksi ada klasifikasi macam-macam ya terus muncul nanti pengetahuan dari aturan-aturan ini dada main ingini definisinya tadi Jadi kesimpulannya Kita bisa cek di sini ya melawan ekskresi untuk menang informasi penting sebelum memilih dan sebelumnya tidak diketahui dari suatu data Hai contoh lain misalkan agan di Twitter ton suka ada tool kalau misalkan eh ya ibaratnya kemarin kita bahas eh bukan di Twitter yang paling gampang tuh di Google Playstore kan ada tuh mobile Legends ya mobile Legends kita Tom bisa mengetahui ini sebenarnya game-nya asyik atau enggak gitu Hai tapi sebelum itu kita enggak belum pernah nyobain tuh kita belum nyampe mobileje kita pengen tahu ini asli atau enggak misal Nah Bagus atau enggaknya ini mobile Legends itu kita bisa ekstraksi dari komentar-komentar yang tersedia di Google Play Storenya mobile Legends jadi semua komentar itu dicek tuh komentarnya ituan kita bisa tahu boleh atau tidaknya berdasarkan rating bintang kan kalau bintangnya 17 Lex kalau dua jelek kalau tiga kita Buanglah kalau tiga ini kan definisinya enggak jelas ya Maksudnya bagus atau enggak gitu terus empat bagus 5 bagus Nah gitu cari itu kita semua komentar itu discribe atau diambil ketemu kemudian kita pisahin tuh Kalian minangsatu bidang bulan bintang 3 di nenteng 1245 gitu Nah itu kita bisa dapat informasi itu kita bisa mendapatkan informasi penting yang sifatnya implisit dari eh apa Tri mobile Legends itu apakah ini gamenya bagus atau tidak destruksi Itu jadi muncul komentar yang ada itu ekstraksi gitu kalau sebelumnya kita enggak tahu ini sebenernya bagus atau tidak karena biasanya kalau di playstore kan biasanya suka muncul yang bintang-bintangnya tinggi dulu kan di atas jadi seakan-akan oh bagus semuanya tahunya kalau misalkan kita cek ke bawah tuh banyak yang minum 1/2 misalkan gitu Nah itu kan jadi kita enggak tahu yang bener itu isi mobile Legends ini bagus atau tidak Hai Nah itulah fungsinya dalam aining jadi kalau namanya itu kita bisa ekstraksi dulu kita bisa ambil dulu semua data-data saya tadi si mobile Apa komentar mobile Legends tadi terus kita olah atau data tadi yang bintang 1245 ekstraksi itu pengetahuan dari sana Oh ternyata mobile Legends ini bagus misalkan Oh ternyata tidak itu berdasarkan mana ternyata bagus atau tidaknya berasal setelah kita mengolah data tersebut dan melakukan ekstraksi gitu pusing deh enggak kan gampang ini mah bedanya data informasi dan pengetahuan Nah ini nih surya kita udah bahas juga sih data informasi pengetahuan Kalau nggak salah di materi yang lainnya udah ada saya udah bahas tentang data informasi pengetahuan hati tolong di cek link Hai Nah kalau misalkan data informasi pengetahuan itu kebijakan kayak tadi tuh kalau misalkan Contohnya apa sih perusahaan mobile Legends kan pengen tahu sebaran data yang mau belajar yang paling baik gimana misalkan dicek tuh sama mereka Oh Jakarta Nah kalau udah tahu Jakarta adalah daerah terbanyak mengakses mobile Legends kebijakan dari perusahaan apa gitu kebijakannya apa Oh berarti kita harus masih giveaway di sini nih berarti servernya harus dinaikin nih di daerah Jakarta berarti apalah berarti apalah gitu ya itu namanya kebijakan berdasarkan pengetahuan jadi dia enggak bisa tuh ngeluarin kebijakan kalau pengetahuan nggak ada jadi padatnya tuh dia nggak tahu nih sebaran data yang paling banyak daerah mana mobile Legends itu dipakai terus dia tiba-tiba belum kebijakan aja daerah Sumedang nih taunya ke Sumedang sedikit orangnya gitu Gan lagipula misalkan Cianjur itu daerah-daerah yang artinya masih di di bawah daerah Jakarta lagi itu yang lebih modern Itu kan jadi nggak nyambung nanti servernya dicepetin bisa Jakarta yang lemot dengan orang-orang pada meninggal in mobile Legends kuganti begitu saudara hubungan dengan berbagai bidang Oh sangat banyak sekali ya siapa nih hai hai hai oh ya jadi data source itu kita sumber datanya dari mana ibaratnya di mobile Legends itu diambil dari Google Play Store gitu Gan data preprocessing kita olah data yang ambil maksudnya ambil Terus pisang itu yang bintang satu bintang 2 bintang empat bintang 5 kalau satu jelek2 jelek 4 bagus 5 bagus gitu data exploration aquaring kita tuh mengambil yang 4S bintang 12 itu ada berapa bintang 45 itu ada berapa gitu terus kita bersihin datanya segala macem terus data maining kita oleh Allah kita olah data tersebut yang tadi itu datasheetnya terus habis itu dipresentasikan datanya menggunakan visualisasi bisa pakai grafik bisa pakai cat apa segala macem lah yang penting orang itu paham data presentation ini adalah orang yang mendengarkannya Hai itu yang gak ngerti orang awam dan mereka harus ngerti Hai dengan cara apa mereka ngerti iringan cara penyampaian kita lebih gampang menggunakan visualisasi tadi pakai grafik atau apa itu terus decision-making dari sini dari segera salon ini kita bisa mengambil keputusan Oh harus begini ohaus begitu-begitu hubungan dengan berbagai bidang tadi lain data main ini ada machine-learning misalnya itu mesin pembelajaran terus Factor recognition bisa pengenalan pola ya disebut pengenalan pola pola pola ini juga bisa Oh kita pakai dimit Processing misalkan suka ada tuh di Jakarta tilang online Tentukan pengenalan pola kalau misalkan CCTV kemudian ada motor yang melanggar aturan pakai helm nanti langsung disorot ke bagian plat nomornya gitu Nah itu sih Injit TV it disisipkan artifisial intelijen atau kecerdasan buatan disitu masuknya investasinya kimia biasanya atau pencitraan digital pengolahan Citra maksudnya dan Citra itu bisa membedakan mana plat nomor mana muka orang gitu itu bisa pakai patung recognition statistik nah dalam biasa testis juga rekaman ini sebenarnya dalam ini juga ada beberapa metode yang diambil dari statistik ke FB ya segitu Terus apa sih saya lupa Hai regresi gitu yaitu computing algoritma-algoritma komputer tetapi teknologi high performance computing yaitu pokoknya banyaklah ya kalau saya bahas satu-satu nanti kepanjangan itu mah contohnya aja hubungan berbagai bidang sebenarnya selain ini juga banyak kita di Kedokteran apa segala macam juga bisa itu kan menyangkut seluruh bidang ya Karena kan dia bersifatnya ke praktis gitu dan juga Hai apa ya ya pokoknya Itulah masalah-masalah itu nama ini tremendous Mount update algoritma Chairul sastra B detail dikarenakan algoritma yang biasa kita gunakan itu Misalkan bisa mengelola 10.000 data misal Apakah algoritma yang sama juga bisa digunakan untuk data yang sangat banyak skalanya sama tinggi misalkan datanya banyak banget gitu Apakah seperti itu apakah bisa atau tidak Hai itu aja dulu gaya mentang-mentang mainin nanti Tugasnya saya kasih di Hai ada tugasnya sesuai kasih WhatsApp grup tapi yang nonton ini selain mahasiswa saya yang enggak usah didengerin bunyinya nggak usah kerja tugasnya nanti Adek Adek ada di WhatsApp grup terus kemudian segala macemnya di sana Oke kita ya Terima kasih semoga bermanfaat dan sampai jumpa