Transcript for:
Kuliah Tamu: Data Scientist dan Data Analyst di Industri

Selamat pagi para mahasiswa Saya senang loh ketemu lagi dengan wajah-wajah yang apa setiap minggu tuh sama ya Eh apa rajin ya saya saya ingat eh apa David gitu ya Ada jti juga dan lain-lain ya mungkin yang sama juga ya Tapi senang kalian apa tetap konsisten ya Eh mempertahankan kerajinan kalian gitu eh apa untuk bisa mengikuti eh apa program yang memang sudah dibuat dengan sangat bagus oleh jurusan ee yang diperuntungkan untuk kalian oke nah hari ini kita kedatangan Pak Gunawan Lumban Gawo eh yang akan memberikan eh materi yang cukup menarik sebenarnya ini juga banyak banget anak-anak ee komputer sains terutama yang EE mulai tertarik ya ternyata data saintis data analis itu juga ilmu yang e oke lagi populer sekarang em Saya harap ini bisa ee menjadi juga apa patokan ya untuk kalian bahwa ee apa di dunia praktisi atau di dunia kerja ini e hal-hal yang sangat diperlukan Mari kita juga untuk ee sama-sama mendengarkan eh mungkin saya sedikit baca ya Eh apa pengalaman eh dari eh pak gunawa eh yang sekarang ada di ee apa home credit Indonesia eh terutama sebagai data scienti ya yang eh terakhir eh tentunya menjadi lead eh data scienti dan juga untuk project-proeknya em kalau lihat cv-nya ini Waduh saya senang kalau memang eh sebenarnya nanti juga anak-anak Eh komputer sains mtinnya punya CV yang banyak Eh mengerjakan proek-proeknya ee terus maksud juga technical skills yang eh ini tidak main-main yang memang eh sangat dikuasai oleh Pak Gunawan jadi eh Mungkin sedikit itu ee perkenalan dari saya saya harap ee para mahasiswa juga dapat mendengarkan dengan antusias dan juga silakan mempersiapkan ee pertanyaan nanti untuk Bagaimana mekanismenya atau trilnya saya silahkan ke Pak Gunawan sebagai ee pembicara ee untuk pagi ini eh demikian dari saya mungkin waktunya saya persilakan Pak Gunawan Oke terima kasih Bu eh pagi teman-teman pas pertama kali join ini itu yang ini kita sedikit informal aja ya karena masih sama-sama muda jadi panggilah gua akan pakai gua dan lu gitu ya gua pas masuk Zoom meeting ini tuh langsung ingat pas dulu kuliah Wah gua dulu kuliah tahun berapa ya 2014 10 tahun yang lalu gitu ya pas masuk masih kuliah S1 Terus sekarang Udah balik kita gua bisa share ke kalian pengalaman di kerja yang udah 5 tahun sekarang diit gitu ya hari ini gua akan coba share ke teman-teman gimana sih di financial industri terutama di home Indonesia kita lakukan yang namanya data analisis gitu slide-nya gua akan udah siapin supaya kita enggak boring kita akan ada sedikit interaksi juga kalau nanti ada pertanyaan teman-teman bisa share pendapatnya di chat gitu ya jadi kita bisa saling interaktif aja Oke ini sedikit background dari gua untuk di homeit itu udah 5 tahun dulu itu dari tahun 2019 sebenarnya sebelum masuk ke homeit gua pernah jadi mobileeloper tuh dulu cat pegang front end-nya Permata mobile X gitu ya cuma setelah itu gua lihat-lihat Wah data science nih menarik nih akhirnya dulu ada program semacam NT untuk data Sins kalau di home credit itu disebutnya data sinence Academy gitu ya kalau semacam MT tapi untuk data science dari situ masuk sampai sekarang sudah jadi lead data scientis untuk background mungkin mirip sama teman-teman kalau gua dari ITB dulunya nya itu ngambil elektro kalau pas tesisnya eh tentang robotis gitu ya Jadi sedikit pahamlah kalau teman-teman dari komuter sains itu biasanya projectnya ke sana gitu ya untuk koneksi teman-teman feel free to connect di Linkin ada yang mau cek github gua juga gua usahakan tetap ada aktif di situ ada beberapa public repo yang teman-teman bisa lihat gitu ya Ada beberapa gua share juga terkait projek yang pernah gua kerjain salah satunya mungkin yang teman-teman Kalau kepo menarik Gua pernah bikin semacam kalau teman-teman ingat dulu sempat Heboh wordle gitu ya gu sempat bikin E gimana kita bisa selesaikan wordle pakai statistik gitu oke sekian dari gua kayaknya udah pada siap kita bisa langsung aja masuk ke materi pertama slide pertama ini gua mau discus dulu nih Apa sih data gitu ya data s itu apa nah data s itu sebenarnya adalah tool untuk membantu kita membuat Decision Making jadi kalau kita lihat ini gua ambil dari skcdk jugah tahu kita bisa thenya yang pertama Apakah kita sedang membuat kalau belum ada datanya biasanyagak kita Ca penasaranja nah yang kita perlukan itua lalu kita masuk ke flow-nya di situ ada berapa banyak decision yangin kita buat kalau hanya beberapa decision yang kita buat contoh decision yang kita buat hanya beberapa kali tapi bisa bisa Life changing Contohnya apa milih jurusan milih kerjaan cari rumah ini obrannya udah agak dewasa ya cari mobil lah Cari mobil cari motor gitu ya itu kan deision yang bentuknya hanya sedikit gitu lalu oke ini sedikit lalu kita lihat di bawahnya ada uncertainty atau enggak ini bedanya Gimana kalau contoh sehari-hari contoh yang enggak ada uncertaintynya apa misalnya bayar pajak bayar pajak kita bisa lihat Oh kalau pajak untuk ee kendaraan sekian sekian sekian eh kita harus bayar sekian sekian sekian berarti kita harus bikin budgetingnya sekian sekian sekian gitu ya yang uncertainty apa kalau misalnya kita mau eh KPR gitu ya KPR terus bukanya floating kita harus pertimbangkan Wah di masa depan ini kira-kira akan jadi gimana besar kecilannya dan sebagainya Begitu juga dengan bentuk barang-barang kredit lainnya dan ini baru kita pak sta tapi Keti unnyaak pting itu kita hanya kali bisa gunakan data anal saja gu ya untuk membu nah bedanya apaarar bilang payung besarnya adalah automation ketika kita ingin membuat decision yang sifatnya berulang kalau contoh sehari-hari decision yang sifatnya berulang itu Contohnya apa kalau di financial industri pasti kita sebutnya credit scoring credit scoring itu kan sebenarnya proses approval atau reject klien yang datang ke kita klien yang datang ke kita bisa ribuan puluhan ribu atau bahkan ratusan ribu dan kita bisa secara otomatis mde oh yang klien ini Risky nih kita gak approve untuk klien yang gak Risky kita gak approve nah yang teman-teman perlu perhatiin di sini ada L and terus lanjutannya ada using data terus ada FL ke atasnya ini sering terjadi gitu ya kita udah gembor-gemboran mau pakai machine learning De learning CNN rfn lstm bahkan transformp semua gitu Yai datanyaak ada ituama ada gunanya gitu ya kita mau machine learning datanya enggak ada data enggak ada ini banyak definisinya satu memang kita enggak pernah collek datanya Contohnya apa contohnya kalau di application form kalau di dunia finansial itu ada regulasinya apa yang kita boleh ambil apa yang kita enggak boleh ambil jadi terbatas gitu terus kita pengin gunain data yang enggak ada misalnya ya Sama aja bohong gitu yang kedua Datanya ada tapi sulit diakses misalnya n gimana Datanya ada tapi bentuknya masih Excel semua datanya ada tapi bentuknya masih kertas semua belum didigitalize itu masih terjadi ya untuk beberapa ee proses data gitu Nah kalau memang kita udah punya datanya dan kita mau mengautomate membuat decision yang berulang kita baru masuk ke machine learning jadi gitu ya perbedaannya analti statistik sama machine learning adalah pertama jumlah decision yang mau kita buat kalau kita hanya perlu sedikit decision kita bisa pakai statistik kalau ternyata UNC di dalamion itu tidak penting ya kita bisa lakukan anal aja kalau kita ingin membuat desis yang sifatnya berulang itu baru kita gunakan machine learning Ya nextnya ini ada beberapait dalam anal yang di sini teman-teman bisa baca dulu sor ini agak ngblur ya tapi basically kita coba wur bareng-bareng yang di gambar pertama ada cowok ngomong ke ceweknya I think we should give it Another shot terus ceweknya bilang We should break up and I can Pro it ceweknya bilang Wah kita udah ggak Cocok nih kita harus putus dan gua bisa buktiin ke lu dia kasih gambar yang nomor dua ada chart gitu ya ke atas sumbu y sama sumbu x-nya terus ada Line judulnya our relationship terus cowoknya bilang ha G ya terakhirnyanya Bil ohungk teruseknya yak Di kita udah langsung ambil konusi gitu ya secara tidak sadareknyaat gambar dekatan keintiman lah misalnya standar skor keintiman terus dibilang sumbunya e lama hubungan padahal gak dilabel gitu datanya gak ada labelnya berarti gak adaaningnya tapi yang ceweknya langsung bisa bilang kayak gitu yang cowoknya ini data apa gitu ya bisa jadiru itu adal ke jumlah berantem gitu jumlah berantemakah kalauah bernya berkurang jangong ini P jadi eh ketika kita data dalam bentuk anal beberapa yang sering diskip pahal cukup penting itualah gimana kitapr visualisasinya nanti akan kita bahas ya Eh yang di sini kesalahannya adalah tidak diberikan sumbu jadi garisnya itu noing dan yang kedua adalah Apakah kita bisa membuat garis itu koneksi antara titi-titik itu itu nanti Ada pertimbangannya juga ya itu kan asumsinya berarti Kenapa garisnya bisa dihubungin kayak gitu Ya berartiahungk diaalnya sebulan se atau itu yang ked ini adais dil ini CL Now I don't terusceweknya bilang sound like the class helpnya bilang well maybe ya maybe maybe di class help kan dengan ikut kelas bukan berarti kita langsung ngerti kalau corelation IMP position gitu ya Eh ini juga sering terjadi ini terjadinya biasanya gini biasanya kita itu ambil data historikal gu ya kita Sebelum analiis data kita harus ingat dulu ada dua jenis yang namanya itu obsal sama yang ada namanya gua lupa imen Bisa dibilang gitu ya ada yang Nam obsal kita Kenya hanakisa Bil kita di klien yang udah lama sama klien yang sudah baru gitu ya terus kita lihat ternyata Wah ada peningkatan nih di e klien yang baru terus langsung kita bisa simpulkan Wah kalau gitu kita harus cepat-cepat nyari kan yang baru supaya sales kita bisa naik gitu ya gak bisa yang bisa kita lakukan untuk membuktikan bahwa korelasi yang kita lihat di observational study ini menjadi adalah dengan melakukan imen eksperimen itu kalau kita sering dengar itu istilahnya adalah testing testing atau eksperimen di industri atau pada yang biasanya jadi kita punyaol GR kita punya treatment gr dan kita punya variabel yang kita mau treat hanya itu caranya kita bisa dengan yakin bahwa variabel yang kitas itu menyebkan hubungan akibat atauasi ya jadi any anal yang kita buat berdasarkan data historal sifatnya meskipun ada angka korelasinya terataup 0,8 sifatnya hanya indas untuk menentukan hubungan sebab akibatnya kita harusakukan eksperimen yang eksperimennya kita kontrol variabiabelin yang Bu vari ama kita baru dari kitaisa Bil adaung seb akibat gitu ya untuk statistik yang terakhir kita bahas machine learning ini yang paling penting ya paling penting machinearsudnya machine lear SY Dia bil the ini yang sering terjadi biasanya kalau kita dari gua lihat kalau untuk teman-teman yang dari backgroundnya engineering atau enger ya itu ketika mau bikin model langsung modelf model terus kalauak berhasil Yaudah parnya itu kurangat yau yang har diiki pertama ketika kitaatahwa per dari mod kita ituelek jadi engak bisa kita sesimpel langsung model fit predic terus performancenya Tinggi oke jalan Langsung ke production engak bisa kayak gitu ya itu comand fitfall yang sering terjadi biasanya kita habis waktu untuk ngetwick Gimana ya supaya model trainingnya cepat Gimana ya supaya kita bisa CR apa kita bisa jalan paralel Gimana caranya kita bisa model yang powerful dan besar tapi bukan ke sana ya utamanya justru kalau ingin improving performance adalah improving di datanya baru kita bicara ke ke model gitu oke setelah kita sudah paham nih ternyata ada tiga bisa dibilang pilarnya ya data anal statistic dan machine learning itu kita lanjut ke tipe-tipe data analtics kita bahas yang data analytics itu ada empat mungkin teman-teman tahu ada kita mulai dari bawah itu deskriptif diagnosti prediktif dan preskriptif dari sumbu kompleksitas dan potensial bisnisnya yang paling poial value tentu saja yang preskriptif deskriptif itu hanya berbicara tentang apa yang terjadi kalau tem-an mau gampang ingatnya yang depan diagn samakp itu hanya bicara tent kejadian di masa lalu UNT yang depannyauin yang di Mas EV hisorical data ini yang pasti pertama kali kita lakukan ketika kita mau melakukan data analisis kita lihat dulu nih Apa sih yang terjadi apa yang terjadi itu bentuknya misalnya kita tahu Oh ternyata penjualan kita menurun nih dibanding bulan lalu sebesar 10% terus 10%nya itu penjualannya penjualannya menurun dari dari jumlah dari jumlahnya atau dari volumenya karena treatnya bisa bed kalau ternyata jumlahnya yang turun berarti yang kita harus lakukan itu akan nanti berbed dengan ketika volumenya yang turun ya Terus lanjut kita Mas ke yang diagn diagn ituus ke Darnya akan jel untuk yangedu kita Bil priktif itu hanya bisa memprediksi based on data yang kita punya based on pattern and TR Jadi kalimatnya adalah kita bisa memprediksi dengan angka-angka sekian gitu ya kita bisa membuat prediksi dengan asumsi bahwa kejadian di masa lalu akan berulang di masa depan itu yang prediktif untuk yang preskriptif itu dari apa yang akan terjadi itu misalnya outputnya gitu ya kalauoringnya Berarti untuk setting eh batasnya disbnya serut Anis gitu ya kita bisa Oke batas yang segini untuk orang-orang yang kita batini untuk orangorang yang kita sekarang kita akan masuk keailnya yang pert itu bentuknya teman-teman bisa tahu count misalnya Berapa banyak sih klien yang female yang Fit ke sales kita gitu ya Terus yang kedua Central limitentral limit ada ada median ada mode ini contohnya rata-rata umuromer kita terus adaure of dispion di sini ada vari dan stand deviasom dan yang terakhir ada atau bisa kita sebutnya sering Des analisis gitu ya contohnya What is ratio of younger to older customer Nah untuk deskrip ini yang kita sering familiar itu paling frequensi Central limit sama dispersion tapi seringnya kalau di industri itu justru kita lakukan juga yang measure of position contoh measure of position apa kalau yang teman-teman udah pernah rasakan itu contohnya ya di beberapa kampus itu ada sistem grading bas on perent at Git Ya berdasarkanribusi normal kalau normal ya itu berdasarkanure nanti kalau di analisis kita bisa perama per dan kita dari S bisa Bik mis matnya dari sisi marinnya Terus yang keahnya mis dariis volumah di adauk al Yang tengah yang positif yang kanan yang negatif yang perlu diperhatiin adalah di sini itu rata-ratanya mirip-mirip ya yang di kiri 58 yang di tengah 57,2 yang di kanan 61,8 kalau kita tidak ngepot datanya atau kita enggak hitung standar deviasinya gitu ya kalau kita ambil kesimpulan untuk untuk hanya dengan menggunakan rata-ratanya bisa jadi kita lebih dari 50% atau kurang dari 50% kalau kita misalnya Oh untuk yang rata-rata kurang dari 58 kitaih anya ya kita akan terya kita akanbih dari 50%50 ya Jadi jugaap kitaakanualnya ini ini nah ini adalah contoh visualisasi di mana yang paling kiri Ini disebutnya asom bas quart itu adalah data yang statistiknya sama jadi rata-ratanya sama e standar revisinya sama korelasinya juga Sama cuma bentuk datasetnya beda banget kalau kita bisa lihat yang paling kiri atas itu yang kita expect biasanya gitu Ya distribusinya normal eh normal terus ada hubungan linearnya dan spreadnya bisa dibilang cukup even gitu Yang kedua itu justru hubungannya enggak linear justru kita Harusnya ngfitnya bukan dengan model yang linear gitu ya kalau ngelihat dari gambar yang kedua bisa jadi harusnya yang sifatnya kuadratik atau logaritmik yang nomor t itu ada outer ternyata itu data yang rapih banget gitu ya tarik garis lurus tapi ada satu outer di atas yang bisa mempengaruhi hubungan linearnya yang keempat sama outer cuma dia datanya eh di sat nilai x yang sama semuanya x sama yang hanya y kec yang out menyebabkan hubungannya jadi seperti itu Jadi kita tetap perlu lakukan visualisasi ya gak bisa kita hanya simp hitung statik terus bikin model dapat perform Seles gak bisato yang yang keduanya ketika kita punya Mod itu yang tengah ini itu pengaruh Dar tik Afri iniak regresi antar in inqu ya dia AF itusah eh algoritma atau model yang yang sensitif terhadap outlier model-model linear regresi itu tentunya sensitif terhadap outlier dan kita mungkin perlu lakukan treatment Kenapa atau kita cek dulu nih kenapa ya data yang di South Africa Kok bisa sebeda jauh itu kalau misalnya teman-teman ngelihat nih Yang di tengah ini ini gimana caranya kita eh dibugnya idenya ya kita lihat dulu nih yang di South Afrika untuk e daerah-daerah yang di sekeliling afrikan Apakah datanya Mirip sama kayak gitu atau enggak atau kita bisa lihat dari data Generation prosesnya Apakah ini kesalahan atau enggak gitu ya Yang nomor t itu ada dari J vanh di 2016 ini semua dataset yang punya korelasi yang sama cuma fnya berbeda gitu ya again kalau kita hanya lihat statistik dan hanya hitung korelasi tapi kita enggak lihat visualize plot dari dataas yang kita punya bisa jadi kita salah ambil kesimpulan gitu ya ini untuk deskriptif next kita akan masuk ke yang diagnostik untuk yang diagnostik ini gua ee pakai biasanya yang kita sebut adalah isu tre Kalau teman-teman cari di browsing gitu ya banyak cara untuk kita memetak ehot dari problem ada yang namanya analisis ada yang namanya dan sebag ya di sini gua mau coba jelas yang namanya is jadi is itu gimana kitaak supaya dari yang kita mau entif itu sinya us itu maksudnya apa maksudnya ketika kita break sumber masalah penyebab dari sumber masalah ini hanya mempengaruhi samp nomor hanyaaruhi B jadi penyebabnya itu tidaking over ituyaa di yang paling mudah untuk kita melakukan dan yang sering kita pakai itualah algeb STR nya ya karena kita bisa idaonen dariak itu bisa dari pros STR ini biasanya kitaak mauakukis Atisa Mar yang mar Dar incre per of per Bu atau kalau dari website traffic biasanya disebutnya berapa sih drop dari step ke step ya berapa sih over ber si itu kitaak PR yang ketig kita bisa pakeptu framewor ininya kita pak se dari marketing Price Place promotion prod dan sebagainya atau the of strategy customer company gitu Kita bisa pakai keptual framewk yang keas ini yang biasanya pertama kali kita lakukan kalau kita lakukan anal ketika kita punya eh segmen contoh segmennya apa usiaa usia muda kli baru terusal di pulau Pulau Jawa di pulau Sumatera by gender yang laki-laki yang perempuan by apa E family status by pekerjaan dan sebagainya gitu ya kita bisa lakukan segmentasi cuma segmentasi ini eh biasanya kurang powerful dan kita harus combine sama tiga yang atasnya atau kita bisa lakukan eh algebraic structurnya yang terakhir adalah opposite Words di sini itu contohnya supply and demand internal exnal financial and non finanal Gu Jadi kita kita lakukan diagnostic anals kita sudahah tahu nih misalnya Dar deskriptif oh dari bulan lalu ke sekarang itu ada penurunan penjualan 20% kita bisa lakukan oh penjualan itu apa sih itualaher perer ber kita lak misnyaakame yang shop kita misalnya ini Bicaranya tentang coffee shop ya coffee shop kita yang di mall sama yang di non Mall misalnya ada enggak perbedaan yang penurunannya ini Apakah hanya yang di mall atau yang bukan di mall gitu ya kita bisa Break Down ke sana Lalu kita Break Down Oh ternyata ketemu nih yang bukan di mall nih yang turunnya turunnya gede banget Ternyata bisa sampai setengah 50% gitu ya kita bisa pakai proses structure Kenapa orang-orang pada enggak beli lagi Oh Ternyata Dari PR ya e lagi store trafficnya Turun nih karena eh di situ ada kompetitor misalnya dan seterusnya dan seterusnya ini teknik-teknik yang bisa kita pakai untuk lakukan diagnostik analtic kalau teman-teman mau lihat lebih detailnya bisa aja isue 3 gitu ya Oke ini untuktic analytics kita nemu y-nya lanjut kita masuk ke prediktif dan preskriptif kita sudah tahu nih Apa yang terjadi di masa lalu dan kita mau e estimate Apa yang akan terjadi di masa depan ini gua akan jelasin dulu conto-contoh pred dan yang kita lakukan di homeedititu ya di financial industri yang pertama sudah pasti ada forecting forecting ini pasti untuk penentuan budget penentuan target penentuan jumlahing dan sebagainya ya yang keduaitoring itu tadiudah gua jelasin bentuknyanya [Musik] outnya yang atau yang ketiga cas-nya di kita ada yang namanya propity modelity model itu adalah kitaomer kita on kemungkinan mereka melakukan atau melakukan buying ke produk kita ada yang high ada yang medium ada yang low kalau kita tahu Biasanya di ilmu penjualan atau marketing gitu ya ketika kudah ada intensi kita harus tangkap secepatnya gitu ya jadibih aruknya untuk prioritasi jadi untuk kita yangudah tahu nihs seb kitaomu ya danusnya yang ke itu mod yang kita booking terus kita mau lihat sampai mereka selesai pinjamannya Ada berapa sihit L yang akan kita tanggung G dari sini juga balik berarti bentuknyating dangeting yang kel ada salah satu juga kita buat yang namanya Mod Mod itu kita bentuknyanya ini kapan orang ini Res atau untuk yang biasanya kita lakukan itu penyebabnya apa sih perstifnya ya tentunya bukan exit interview ya Kalau interview ya orangnya udah keluar gitu perstifnya Oh ternyata orang-orang tuh kendalanya di sini gitu ya atau kalau bisa dilihat Oh ternyata darinya kalau yang sakitnya setiap Senin selama 3 minggu bertut iniudah Res gitu ya jadi kita bisasung Inter belum dia bukan kabur ya untuk menjaga dia di kita kitu Oke kita lanjut oke kitaap dulu ya sebelum ke yang jadi untuk yangkp untuk yang data [Musik] analureuk yang diagnnya kita bisa Pak Is ada ada konseptual Framework itu kompetitor dan sebagainya ada breakdown yang lain gitu ya Ada lima untuk yang case case prediktifnya yang di financial industry contohnya yang barusan kita bahas Sekarang kita mau bahas Lebih Detail terkait workflow yang kita pakai untuk lakukan data analiticsnya gitu ya next ini workflow yang teman-teman udah mungkin familiar tapi yang gua mau highlight di sini adalah lingkarannya gu ya yang sering dilupakan itu adalahopingnya jadi yang sering terjadi itu dari bisnis request Tolong dong analisis a di B Kenapa C lalu kita kerjainih ke usernya Oke selesai itu bukan ya-ter pasudah nger itubih dariali itu yang sering kita forg jadi Dim itu kita harus Qui jadi ke Dar itu di kita bisaakanya kita tanyaanya se jadi si usernya usernya mintanya a ternyata dia sebenarnya mintanya Z gitu ya itu yang sering terjadi that's why ketika kita lakukan analytics kita harus iterate cepat iterate cepat kita udah punya baseline analisisnya kita balik ke user ini udah sesuai atau belum Kalau belum kenapa Lili dan kita iterate lagi jadi jangan sekali aja gitu terus dan selesai finish itu enggak ada looping-nya ya oke itu yang paling penting diingat di kftdm kalau dari opini gua ya yang pertama bis understanding defining OB anditeria ini yang penting karena eh seringki gimana kitaanslate bis problem ke dalam bentuk data analisis problem itu ada missnya ini yang harus sering kita komunikasikan kepada stakeholder kita tolder kita juga harusaj Gimana cara mereka nah ini ada tools yang kita bisa pakai itu adalah power influence interest Matri di sini nanti kita bisa petakan Oh orang yang inflya banyak dan internya banyak kita harus keep in touch keep in touch kita bik reg meeting kita selalu ikutkan diskusi gitu ya untuk yang Power influnya sedikit tapi interestnya banyak ini berarti orang yang jbjb gitu ya jbb dianyaak punya yaudahup diin gitu ya karena toh dia juga enggak ada pengaruhnya kan enggak bisa bantu juga di dalam Project kita itu untuk contoh Gimana cara kita managing stakeholdernya jadi report yang kita kasih kalau kita mau tanya XP kita tahu Oh kita harus tanya ke orang ini nih untuk untuk orang yang Power influence-nya tinggi tapi interestnya kecil itu kalau bisa ya kita usahakan dia punya interest lebih di Project kita ya kita bisa discus dengan mereka eh bimana viunya mereka dan sebagainya jadi kita yang lebih proaktif gitu ya untuk orang yang Power influence-nya rendah tapi interestnya gede ya ini kita biasanya atau Pis kita gitu ya kita kan interestnya sini tapi kita masih Eh belum punya cukup influence itu atau technical members pice dari function lain oke setelah kita tahu define objektifnya dan jadi data analisis problem yang kita perlakukan adalah data undering data understanding ini perlu diperhatikan yang paling ptingal apa asumsinya kita harusip ini ternya ituingnya diaalid itu harusnyaak bisa kita bisaak yang adaing di Oh ter eh input KTP ktp-nya itu ternyata prefield loh dan prefield-nya ini misalnya dari sumber yang mana gitu ya ya kita berarti Oh asumsinya ini prefil berarti eh kita bisa pakai atau enggak ya nanti tergantung analisisnya kayak gitu ya jadi itu pitf where to look for data ini cukup jelas kita bisa tanya ke it kita atau orang yang memanage database kita data A di mana data penjualan di mana hubungin ke kinnya gimana dan sebagainya ya kita bisa tanya sama orang ya yang ketiga yang paling penting itu karena ini yanging utama ketika kita mau Mul angka G Ya kita harus tah nih gim kitaanya kepada bisis yang datanya kalau kita in tah dat kitaanya ke orang kitaeng tah dataanya ke tanya data terit mobile aplikasi kita kita tanya ke orang yang bikin mobile aplikasi kita ya Terus yang ke ini maksudnya gim keka kita analis unuk mengah supaya kita gak lari ke mana-manaka nan tem- mungkudah punya pengalaman juga ya ketika kita lagi guab terus ini Man ituus nya dan cara ngesegmennya gimana Misalnya kita hanya mau lihat Oh gua mau fokus hanya untuk orang-orang yang masih baru atau klien yang sifat Gimana caranya gua Def segmen ini di database kita Kita juga harus ngerti yang ketiga itu adalah step data preparation preparation ini ketika kita udah tahu Oh gua mau ambil dari database a databas gua gabungin jadiin kita yang kitaakukan ak misalnya Terata datanya batas indonesiaaknya di Lau yaus ku yaus yang kkaudah punya datanya kitaakan kita hitung juualan bulan lalu lalu kita harus CR dengan PR rep yangudah ada kalauudah ada ya at dashb yang dimilikiak angka yang kita iniama yang Mere punya di kalauak ber adaa kita ya ini Pama CR di ada kode-eentu9ya ini atau artinya ininya at atayim kita danambil kita yang keak ada ada dua ya ada modeling yang kita lakukan untuk analisis atau ID ada modeling yang kita lakukan untuk memprediksi masa depan gitu ya memprediksi modeling yang kita lakukan untuk analisis itu kita bisa lakukan simpel model atau regr biasa aja yang kita mau lihat adalah Misalnya contohnya dari yang tadi kita udah punya eh data bulanan nih data bualan penjualan kita bisa hitung penurunannya terus kita bisa hitung juga data-data yang lain penjualan tadi misalnya jumlah kontraknya sama volumenya kita ya bisa lakukan regresi dari variabel kontrak sama volumenya ke penurunannya yang mana yang paling besar mempengaruhi ya kita bisa lihat dari koefisien regresinya gitu ya J jadi modeling itu juga bisa kita lakukan untuk analtics gitu atau yang kedua misalnya untuk funel funel kita mau lihat customer Yang Yang drop gitu ya dari step s ke step du ya kita bisa bikin aja flagnya customer yangopnya S customer Yangnya kita bikin variabelariabel independen demografi sebagainya kita bikin model modelnya keluar manaaktor signuh orang ini jadi gitu ya Ada jenis kalau yang [Musik] hubungan antara variabel yang penting lagi di moding adalah kalau kita mauubung lgbm atau bahkan bisa pakai neural network gitu untuk yang kelima itu setelah kita udah jadi modelingnya entah modeling yang analisis atau modeling kita lakukan evaluasi kalau di data analisis evaluasinya ya dalam bentuk report dalam bentuk report ini yang penting adalah Gimana cara kitaomunikasi ke stakeholder tadi tu yang di poweru Matri kalau yang sifatnya High Level ya berarti kita cukup bicara general Kenya aja contohnya udahahu nih ada penjualan menurun di 20% ya kita langsung bilang penjualan turun di 20% disebabkan oleh segmen yang bukan di mall karena prosesate 1 3 itu udah cukup Gitu ya suarynya selesai kalau kita bicara ke yang lebih teknal baru kita break Oh ini terjadi di bulan ini jumlah total customerini yang signifikan ini dan sebagainya Itu yang kita kita perlu latih nanti ya Jadi gimana cara kita komunikasi ke stakeholder yang sifatnya High Level atau ke temaneman yang teknikal karena kita dari teknikal kalau untuk ngomong ke teknikal ya kita sudahah lancar gitu ya jadi yang kita perlu coba itu nanti gimana kita comunicate ke yang nonchnical ya yang paling simpel jangan gunakan jargon-jargon yang membingungkan gitu dan yang setelah kita bikin Reportnya atau draft Reportnya kita present lalu kita for feedback dan kita lakukan loopingnya jarang sekali ketika kita lakukan analisis sekali jadi gitu ya pasti akan ada eh addal requirementnya atau ada analisis yang perlu kita perbaiki lagi dan kita looping balik ke b understanding dan seterusnya yang terakhir kalau udah final Apakah deionnya ternyata dari analisis yang kita buat kita mauakukan campa ya berarti kita perlu dari analisis kita kan kita sudah dapat tuh segmen yang mau kita ee bikin campaign-nya kita perlu bikin trackernya atau pot for campaign-nya dan monitoring untuk kymrixnya kalau action point dari presptifnya adalah kita buat gitu again untuk Kris DM yang penting adalah lingnya jadi ke kita lakukan analytics itu harus it fail quickly dan itate fast G ya Jadi kita jangan sampai hanya sekali doang Ngomong samaer Ken itu karena yang tidak Ses Oke kita lanjut sekarang ngobrolin tool kalau di industrinya kalau infrastruktur itu untuk rdbms-nya kita pakai Oracle big datanya pakai Spark atau F Spark ya dan kita juga ada cloud untuk yang IBM itu beberapa company ada yang pakai gitu untuk cloud-nya Mungkin ada yang pakai aws untuk database-nya mereka yang kedua Eh untuk visualisasi toolnya itu kita bisa beli misalnya untuk Tablo Tab itu yang berbayar kalau Excel ya Beberapa ada yang bisa pakai subtion untuk koneksi langsung ke database dan berbagai Bi tools lainnya Oracle juga ada Bi tools-nya bisa juga untuk power Bi dan sebagainya gitu ya lanjut untuk software kalau di home credit itu kita pakai Python kita bikin modelingnya itu dengan Internal libraries kita tapi kalau di bank-bank atau di industri lainnya kita enggak tahu ya bisa jadi mereka menggunakan vendor atau enggak atau mereka develop sendiri yang sering dipakai biasanya tas itu kalau SPSS itu biasanya ketika masih kuliah gitu ya untuk teman-teman yang dari Jur sosial pasti ngerti SPSS untuk R itu lebih sering dipakai di Akademi gitu atau di bidang biologi karena untuk yang sifatnya biology itu library-nya lebih banyak di art nah yang terakhir kita bicara dengan cloud service kalau Cloud service ini biasanya one stop solution for all ya Jadi mereka handle end to end dari database-nya adainya ada analtic softwareen juga ada untuk Azure bahkan kita tahu kalau Microsoft kan udah punya Lensi Open anya ya Jadi mereka udah bisa langsung end end bahkan sampai solusi a untuk Google juga sama dan aws ini tig yang paling Pop yang paling penting yang mau gua sampaikan ke teman-teman ketika kita mau gunakan tool to Maksudnya apa Maksudnya kita misalnya nih anal data cuma 10.000 gitu ya tapi kita maknain pakai Python buat apa gitu ya kalau ternyata di Excel piv lebih cepat danudah selesai not P akhirnya tools ini akan selalu berkembang gitu ya jadi kita jangan terlalu fokus ini biasanya mist dari teman-teman yang backgroundnya engineer gitu ya atauuter S kita terlalu fokus sama mastery of the tool tapi bukan understanding the jadi kita udah bergulat di pythonnya kita Wah keren nih kita bisa pakai library Pandas yang 2.0 kita bisa pakai W operator untuk ini segala macam kita pengin Pak gitu untuk analisis no gitu ya itu boleh eh itu gak salah itu tetap boleh tapi sebelum ke sana kita harus udah siapin baseline solutionnya dulu jadi kita harus tadi balik ke yang workmnya harus itate quickly dan F fast kita udah harus punya solusi basnya dulu baru kita kerjain yang lainnya It's OK karena kan itu juga sebagai S data Scientist gitu ya dengan perkembangan teknologi yang cepat itu kita juga harus keep up with the current trend misalnya untuk modeling library yang populer misalnya gitu ya tapi ternyata nanti muncul library yang lain atau sebagainya itu kita harus up tapi yang paling penting pertama kalau datanya ya cuma 10.000 atau 100.000 ya Excel selesai Ok No problem gitu kalau baru kita ngomongin data yang sifatnya sejuta di Excel tu ada batasnya yanya sampai sejuta doang atau gini sebelum sejuta Oke Exel yang dial kita gak bisa yaudah Pak clouduternya bertiulas dioud sana di microsoftuk yang online Exel kalau masih bisaok kalau gak bisa baru kita lanjut nih oh datanya cukup komple nih kita perlu Lakukan analisis lebih Cep Yaudah kita Pah ke pyon mis kita pakand kalau itu masih kurang dan kita perlu lakukan agrasi yang lebih cepat sifatnya misalnya eh miliaran gitu ya atau jutaan dalam puluhan ratusan juta atau miliaran baru kita move on ke Spark jadi use the right to for the right job kalau di industri biasanya yang kita lakukan ya agregasi dari atas ke bawah jadi kalau data semacam panel gitu ya data yang seper jutaan kita agregasi Dipa baru kita ke p untuk analisis dan S checking baru finalnya kita bikin udah yang untuk agregasi ke Excel dari Excel baru kita bikin Pivot dan visualisasinya itu untuk Project data analytics gitu teman-teman atau ya kalau mau mudah langsung pakai service aja cuma ya kelemahannya pasti berbayar gitu ya setiap select keluar itu duit gitu ya bisa boncos Oke lanjut nah ini gua mau sekarang ngomongin sample case yang credit scoring jadi kit scoring itu sebenarnya kalau kita mau KPR rumah sifatnya yang barang-barang yang jangka panjang gitu biasanya masih ada yang namanya credit expert jadi credit expert ini adalah orang yang menganalisis eh kemampuan bayar banyak aspek lah intinya dianalisis Apakah orang ini benar-benar mampu nanti balik duitnya ke bank gitu ya untuk bisnis biasanya juga ada k expertnya Nah kalau untuk consumer landing dulu itu masih banyak kit expert di tahun 2017 2015 MTI masih baru gitu ya fintech belum sebanyak sekarang lah sekarang fintech kita sebut udah ada banyak banget dulu itu masih ada orang yang memang menganalisis nih Orang ini dilihat dari apa Misal SOS dilihat dari data rumahnya atau sampai didatangin gitu ya alamatnya rumahnya kayak gimana kemampuan bayarnya Kay gimana Eh seperti itu prosesnya dan dia akanakukan tabulasi danoringtuk lihat oh yang ini bisa kita kalau sekarang sebanyakan fintech atau bkan bank punudah mulai untuk menggunakan yang namanyatuk yangum ya kalau bnya adauk yangum kitaak yangitingingga kita bisaakah kita itu siatnyaudah bisaud sudah bisa approve klien tuh 3 menit 3 menit sudah bisa kita approve itu Real Time enggak perlu nunggu 1 hari sampai 2 hari dulu kalau sekarang kayaknya semua udah hampir bisa gitu ya Eh banyak pilihan fansial kredit yang di online pun juga udah bisa instant approval gitu ya Nah di sini eh bisnis bisnis problem-nya adalah gimana kita bisa lakukan si credit scoring lanjut objektifnya ya kita transisi contohnya ya Misalnya ini kita ingin transisi dari cre expert base SY untuk akuras kisti dan e lanjut jadi unuk meningkatkan akuras juga bisaingu yanyaak perungukah iniisaak lanjut solusinya kita berarti perlu lakukan yang namanya pred di sampai pred ya Jadi kalau di Biasanya kita hanya Bik model samp outporing unuknya gitu yaor berap sih yang mau kita at engak itu biasanya kita serahkan ke tim kalau di final Ind ada yanganya under itu dari underwriting akan gunakanor kita salah satu komponennya bersamaan dengan matriks yang lain dia akan Tentukan nih batas Mana nih yang ini yang diove yang ini direject kayak gitu ya Jadi kalau untuk data Stis kita hanya sampai ke pred annya di sini gua ambil contoh dari kle Home Credit kalau teman-teman yang mau ngerti banget nih modeling di modelingit gua bilang baca k homeit dari Top solutionnya ituud lah 80% sudah hatam Gimana cara mereka ngolah datanya dan sebagainya itu Ah ada sebenarnya semua di sana gitu Ini gua coba ambil simple case-nya gunakan data demografi aja ya kita lanjut nah yang kita lakukan pertama di sebelah kiri Kalau teman-teman mungkin sudah familiar ini di Pandas kita hanya ambil demografi dari yang paling kiri kita bisa lihat kolom targetnya itu namanya target di situ ya total rownya ada r7.000 terus dari yang paling kiri kita bisa lihat ada dua eh variabel yang punya missing values apa aja itu adalah k members meskipun cuma du ya di situ terus ada occupation typ nah lalu kita pisahkan nih Mana yang sifatnya kategorikal mana yang sifatnya numerikal kalau pengolahannya di sini kan ada yang ada di sebelah kiri ada tuh yang tapi data typennya masih integer atau numerikal itu kita perlu buat supaya kategorikal karena flaging itu kanally sebenarnya sifatnya kategorical Ya hanya yes or no atau no jadi key POnya we have a total of 3 R total paritas 19 lanya numerikal 14nya kategorikal ada du yang punya missing valu C members dan occupation lanjut ya di sini baru kita hitung measure of frequency Central limit position ya ini langsung kalau di Python mudah tinggal Describe Inut all Nah di sini mungkin kalau chatnya aktif teman-teman aku ada pertanyaan bisa enggak teman-teman Spot anything yang aneh atau anomali sini yang perlu kita Deep dive dari sini aja ini chatnya di disable gak Ya enggak tahu sih kalau ada mungkin teman-teman bisa ketik di chat dari data ini ada enggak yang anomali atau yang Stand Out kalau salah jawab nilainya berkurang ya enggak ya harusnya ya Nah di sini oke kita I Betulnya negatif ada lagi ggak Thank you Josua Nicolas nice ada lagi yang aneh se negatif tapi ini yang empnya juga yang nya benar negatif tapi ada lagi yang aneh sebenarnya ayo teman-teman kuninya ya kalau kuncinya adalah speed dari sini ada lagi enggak yang aneh dari kita lihat satu-satu ada yang masih mau jawab Oke oke kita bahas aja ya yang pertama amount dari amount total dulu nih kita lihat rata-ratanya 168.000 terus maksimumnya itu lihat satu berapa tuh nolnya banyak ya nolnya ada 6 juta berarti kita bisa lihat Oh ini ada out kita perlu investig nan kita harus ni yang kita in ya yang kedua children itu maksimumnya ada yang 19 Wah ini orang punya anak 19 Ben gak nih gitu ya mungk ini nega karena ini Ben semuanya nega ya Dar x-nya negatif karena sifatnya adalah menghitung dikurangi ke Days of application-nya jadi Days of application dikurang date of birth jadi Days birth jadi kalau mau bikin Days day apa Age dalam untuk Years nanti Days birth-nya kita perlu bagi 365 justru yang aneh adalah di Days employed kalau kita lihat dari minimum value-nya di situ ada 17.91 sedangkan maksimum valum-nya positif ini yang aneh karena Harusnya kalau dengan asumsi yang sama kayak engak mungkin ada nilai positif berarti kita harus cek yang selanjutnya gender gendernya ada ttig UN valnya ya bukan cuma male female berarti kita harus cek apa nih satunya Padahal kita lihat di sebelumnya gendernya gak ada n valnya kan gendernyaak valnya Tapi unnya ada t kita harus cek satu lagi nih apaaningnya gitu Apakah itu sebenarnya n yang ter tidak jadi n ya teman ya jadi dari simple descrip ini kalau kita teliti itu ada udah kelihatan mana-mana yang harus kita investigate fther gu yang sering terjadi adalah karena kita suka nging ya gua juga suka ngoding sih ketika udah ini ini Aduh malas banget nih mau langsung modeling aja L gak bisa apa gitu kan Ya engak bisa Guys kita harus cek dulu dari sini dari sini aja udah tadi ya udah beberapa poin yang harus kita lakukan analisisnya dulu sebelum lanjut ke step selanjutnya dari sini kalau mau ngomongin measure of frequency kita lihat targetnya dulu Oh targetnya dari Min Berarti ada 8% orang yang default dari dari eh gender Oh sebagian besar female 202.000 Dib 307.65,8% terus kita lihat median income-nya di 147.000 ini dalam dolar atau dalam Euro ya atau dalam ini nanti kita lihat apakah ini itu di rata-rata income secara general Kalau ngomongin Indonesia ya Misalnya kita dapat data rata-rata incomeennya R juta ituur tem-an tinggi apa rendah per bulan juta per bulan engak ya ituudah toput peranud Karen Jaka ber ya ya Jadi kita bissat yangau dari situ kita sudah dapat background eh datanya dari umur nanti kita bisa lihat ini yang tua gimana yang ada Berapa usianya dan sebagainya ya Dari sini terus dari sini kita bisa lihat Oh Ternyata di application form-nya itu ditanyain loh name income-nya education family statusnya housing type-nya occupation-nya apa punya mobil atau enggak dan sebagainya di sini juga bisa kita lihat ada orang yang enggak punya eh email gitu ya atau atau data emailnya itu yang punya hanya sedikit ternyata tuh cuma 5% gitu jadi data email cuma sedikit segitu yang punya Sekian dan sekian itu bisa langsung kita dapat bayangan Oh Ternyata kalau orang-orang yang ggak punya email ini kenapa apakah karena memang engak di Apakah ini opsional di application formnya atau memang eh sumber datanya lain itu bisa langsung bisa lihat jadi kita punya benchmarknya Jadi kalau udah analis yang sudah senior itu basanya untuk setiap variabel itu mereka udah ada nih benchmarknya oh gu gua ek harusnya segini Oh gua harusnya segini Oh gua ek harusnya umurnya tuh segini gitu jadi Sudah bisa lihat kalau ada terjadi anomali di datasetnya itu yang harus dibild by experience ya Tergantung industrinya Oke kita lanjut setelah kita tahu apa yang perlu kita analisa eh kita lakukan data preparation data preparation yang pertama adalah fitur engineering fitur engineering kita tadi bikin dalam bentuk tahun ya kita bagi Min 365 Terus ternyata yang disemploy tadi itu adalah data yang diill in Jadi kalau yang gak ada itu diisi dengan 365243 jadi kitalace sama n valu terus kita baru bisa bikin data employ yang lain yang bisa lakukan itu misalnya kalau kita pengin bikin interaksi gitu ya antara umur sama gender misalnya atau umur dengan Years employ misalnya gini misalnya dari umur orang umurnya 20 nih eh sor orang umurnya 25 tapi Years employnya baru s sama orang yang umurnya 25 Years employnya udah 5 tahun kira-kira lebih yang mana kemungkinan besar akan lebihki yang baru kerja S tahun gitu ya jadi kita bisa bikin engineeringnya adalah rasio dari employ Kenya misalnya kayak gitu kita dan pembentukan fitur engineering ini itu biasanya dilakukan dengan bisnis knowledge gitu ya kayak tadi apa yang sense kita bikin yang kita mau tes gitu ya benak sih orang yang rasio antara itu semakin kalau semak kecil kita bisa bikin variabelnyaak dibuat ya Terus yang setelah kitaah bikin fiturfiturunya baru kitaak hubungan antara si variabel dengan targetnya kalau di sini gua plot name income type dan name education type kalau kita lihat yang dari sini Itu kan groupingnya tuh ada en tuh 1 2 3 Sorry untuk yang income tuh ada tu tapi ternyata yang valusnya komersial sesu cuma dikit banget jadi Selanjutnya Apakah kita bisa lakukan grouping gitu ya Misalnya yang Comal associate Ya udah kita gabungin sama bisnisman gitu terus yang unemployed Ya udah biar stud kalauak bisa digabungin Yaudah kena jumah [Musik] yangategor ya Yang ya Ca segitu cuma sama 16 Apakah ini signikan at engak Harusnya bisa kitailai w ini gak sign bisaing ke yangin jadi perb jauh itu yangal ya yang 5%al 7,4 kita lebih kecil kayak gitu begitu juga kita lakukan Analisis untuk yang education type untuk yang numerical biasanya kita PL adalah distribution plot kalau menurut teman-teman dari du predor ini Mana yang lebih powerful atau employ coba bisa dijawab Diat menurut teman-teman dari Univ analisis numical dengan distribus ini Mana yang lebih eh powerful atau punya korelasi tinggi ke targetnya yang AG apa yang employ Wah bingung kira-kira yang mana nih kalau ngelihat dari plot yang analisis numerikal ini yang kita lihat itu adalah seberapa overlap mereka gitu ya kalau kita lihat yang employ antara yangult samault yaingnyabih bes Dar jadi kita bisa simpulkan oh yang ini lebih strong daripada yang Years employed gitu dari analisis distribusinya untuk yang memorikal yang selanjutnya itu adalah fiture selection ini kita bisa lakukan dengan korelasi jadi kita hilangkan korelasi yang rendah ke target atau yang punya korelasi jadi kita pilih Nih misalnya ada dua prediktor yang satu korelasi ketargetan lebih tinggi 0,7 yang 0,5 Terus yang dari terus dua k ini punya korelasi tinggi satu sama lain 0,8 Ya udah kita pilih salah satu misalnya kayak G atau yang kedua untuk lihat hubungan nonlinearnya kita bisa lakukan seleksi berdasarkan Ance lanjut setelah kita lakukan data preparation sudah kitaek dan sebagainya baru kita lakukan modeink gua simpel cuma akan pakai duit aja yang kita pakai DII untuk lihat signikansya juga dapat Fal modelnya sekitar 19,7 g gitu ya untuk matriks yang biasa kita pakai karena ini hanya untuk penentuan ranking gitu ya hanya untuk penentuan ranking matrixnya biasanya ROC aoc atau gini kalau kita care terhadap actual angkanya baru kita hitung mse-nya atau Eh kalau untuk data yang sifatnya binary ada yang namanya brer loss-nya tapi sebenarnya itu sama aja kayak RMS RMS di angka karena kita hanya untuk menentukan batas maka yang kita pakai gnya ya kita tambahinnya kita Tambah data yang lain yang numeral demograi danerusnya gitu ya jadi ini ya ini bisa selesai mungk sehari kurang gitu ya dan kitaudah bisaak sebelumnyaan mod yaudud B tadi kita udah bahas banyak e mungkin langsung lanjut bisa ke Oh ya lanjut ke kesimpulannya Jadi intinya Ini guae ambil dari salah satu Bu salah satu dari decision scinya di Google ini wanita namanya kov tem-eman bisa cari itu dia bikin blog medium cukup bagus kalau tem-al dia bilang per Jadi kalau tem-an memangeng jadi data anal gitu ya kuncinya adalah speed tadi quily gimana cara kita bisa quily kita harus mastery of dan mastery of oke sekian dari gua Mungkin kita bisa lanjut ke Sesi selanjutnya Terima kasih teman-eman baik terima kasih Pak kita lanjut ke sesi tanya jawab mungkin masih ada kesempatan untuk dua mahasiswa atau tiga mahasiswa yang mau bertanya silakan mungkin saya pancing dulu ya Pak ya Eh tadi kan bapak bilang eh apa eh lakukan selalu iterasi ya Nah ee Kapan sih ee saat tepatnya tuh lakukan iterasi gitu loh terus ataupun eh harus berapa kali iterasi yang dalam prosesnya itu harus dilakukan Oke kalau bicara modeling kalau memang datanya baru gitu ya Bu ya biasanya itu bisa sampai EMP kali dan sifatnya entah wely Biasanya jadi kita ada wely update bisnis dengan si stakeholdernya lalu kita dari situ kita update progr gitu tapi di yang pertama kita udah bisa present solusi yang Udah ready gitu ini ini pun sudah bisa kita implementen baru kita bisa improve dari sana kalau masih ada waktu gitu sih baik ya itu saya sudah bertanya Mungkin ada teman-teman yang mau bertanya atau ini benar-benar itu ya Eh mengagumkan ya sampai udah udah dicerna dulu semua gimana ee kebetulan ini Pak dari di computer science eh School of computer science ini kita ada beberapa jurusan ya jadi ee Ini juga Memang eh sangat beragam eh apa untuk [Musik] anak-anaknya kira-kira ada yang mau bertanya boleh langsung apa on mic buka eh apa mikrofonnya dan silakan bertanya atau mau chat Rehan kayaknya mau tanya nih Rehan k baru bangun tidur Rehan Rehan Wilbert bertanyakah Rehan atau angkat tangan Oh enggak Oke Baik kayaknya Berarti semua sudah bisa menangkap ya Eh apa yang telah diarekan oleh Pak Gunawan kalau eh begitu oh oke oh tadi an ini Maa eh mau tanya oh iya silakan ya E pagi E mau tanya e tadi kan kakak sudah nyebutin kan tools yang dipakai itu kan mesti kayak sesuai dengan kebutuhan perusahaan kan Kak Nah itu tapi ee buat kita itu kayak misalnya kita belajarnya Python terus tapi tiba-tiba mesti belajar bahasa programan yang lain gitu Nah itu cara supaya bisa cepat untuk memahami bahasaemogramnya itu gimanaasih ya Ini pertanyaan menarik ya terutama untuk teman-teman yang dariuter Sain kalau programing language itu menurut guaya abak pru berpik komp itu High Level dari programing language Gimana caranya kita memecah Masalah Jadi step-step yang bisa kita breakd bisa kita lakukan jadi itu bukan masalah kayak dulu gua itu belajarnyaru++ gu ya baru di industri kita pak pyon ok kita lear juga gak masalah toh juga ada tool yangudah bisa kita bantuin ya kalau teman-teman belajar ponnya itu Ben Maksudnya yang dipelajari ituru gimana berpikir komputasinya program yang kita akan di masaan bahkan ketikaakah hanyaageudah daripinyausnya [Musik] lebih ke understanding-nya gitu ya kalau itu udah dapat harusnya semu E mau nanti ada programming language Mojo gitu kan ada yang baru ada apa it's ok sebenarnya baik Apakah menjawab tadi yang bertanya Enggak resen saya enggak tahu nih Siapa Oke ya Eh menjawab terima kasih Oke Baik Pak ada satu lagi di chat eh mau tanya Eh ini dari saf eh mau tanya untuk mil learning machine learning yang bagus itu gimana Terus untuk cas problem Seperti apa eh soalnya kemarin katanya harus tes semua machine learning Nah kira-kira mungkin kurang lebih seperti itu sih pertanyaan Oke mungkin boleh dijelasin yang Maksudnya harus ngerti semuaarning itu Gim Oh iya pak izin ini ya J Jadi kemarin itu e sempat bingung kan dan nanya di kelas kalau misalnya milih machine learning tu bagusnya apa soalnya kan banyak banget tuh pak dan Bapak tadi juga ada mention machine learning apa aja dan problem cocok untuk digunain sama machineing itu kan Nah jadi eh apa memang benar harus dicobain semua gitu atau atau kita punya referensi sendiri kalau misalnyaing ini itu cocok untuk kalau gua ini subjektif di masing-masing orang tapi gua akan start selalu denganibus belajaribus sampaiam itu selesaiur Yat ituudahu ke reg lustri itu belum ada kita Dien pertama misalnya ya untuk model-model yang kita perlu tahu reasoning Kenapa orang ini skornya segini kita masih harus pakai model linear atau model yang sifatnya Tris kalau Tris kan ada beberapa metode e interpretasinya ya interpretasinya itu sudah ada jadi cuma dua itu aja Kalau saran gua kalian belajar exibus linear regression Logistic regression udah cukup oke Pak Makasih Pak Baik terima kasih eh saf mudah-mudahan itu sudah menjawab Ya masih ada lagi kak di chat Oke sudah enggak ada eh mungkin terakhir eh mungkin secara cepat Ini dari bu Sanya ada informasi Ya seperti ee yang kita tahu juga mungkin ada teman-teman ini yang cuman magang satu semester ataupun ee memang eh ikut program kampus Merdeka masih boleh ikut lagi nah ini ada kesempatan dari home kredit Eh untuk eh apa eak bisa ikut eh dalam eh dari Home Credit ya mungkin Bu senya mau informasikan dulu sebentar mohon waktunya ya Pak Gunawan boleh ya Pak ya Iya oke terima kasih eh ibu atas kesempatannya jadi teman-teman e mungkin tadi Eh udah sedikit mendengar gitu ya kebayang eh e data analis and also data stist yang kredit Indonesia itu seperti apa gitu ya Nah kalau nih teman-teman pengen eh jump in langsung eh gitu ya ngerasain kira-kira eh as a data analis itu gimana sih gitu ya Eh specifically in home credit Indonesia jadi saat ini kita juga lagi buka gitu ya Eh lowongannya untuk kampus Merdeka jadi eh internship program ini eh akan berlangsung selama 4,eng bulan di mana Nanti untuk deadline rerutment-nya itu nanti eh deadeline untuk teman-teman apply gitu ya itu ada di sampai tanggal tanggal 10 Juni nah positionnya ada apa aja sih gitu ya so right now we have more than eh 100 seats dan juga 70 70 position gitu ya Eh teman-teman nanti bisa lihat di sini ataupun nanti di website eh apa namanya kampus Merdeka yang langsung book open aja langsung home credit Indonesia Eh ini adalah eh positionp yang teman-teman bisa apply bahkan ini tuh ada dua halaman gitu ya Eh jadi bisa dilihat aja bahwa eh banyak position analis gitu ya jadi eh e analisa ini tidak hanya eh apa namanya eh jadi beda-beda gitu ya jadi contohnya nih dari HR sendiri gitu ya teman-teman bisa lihat bahwa di HR sendiri kita ada position untuk internship HR data analy Eh tapi selain itu juga teman-teman bisa lihat di it-nya apalagi ya Itu banyak banget ada lebih dari 20 position untuk teman-teman bisa apply atau misalnya ternyata teman-teman tertarik untuk eh apa namanya eh explore ke hal lain gitu ya mungkin yang eh bukan analis ataupun it gitu ya bisa dilihat aja gitu ya ee atau misalnya teman-teman pengin rasain ah pengin rasain Ecar data analis tuh kayak gimana atau si RM analis tuh kayak gimana sih gitu ya di sini juga ada antif frud analis ada risk analis gitu ya Ada underwriting technology analis juga yang tadi Mungkin sempat eh sedikit diceritakan oleh eh apa namanya eh Mas Gunawan eh eh apa namanya ee pekerjaannya seperti apa supaya teman-teman terbayang gitu ya Nah ee Jadi kalau misalkan teman-teman tertarik gitu Ya silakan langsung aja apply ke ee eh Link yang sudah aku share juga di dalam chat gitu ya Eh deeline-nya nanti akan sampai dengan 10 Juni untuk teman-teman apply programnya 4,eng bulan sama Nah mungkin sedikit nih kalau misalnya teman-teman pengin lihat implementation programnya itu seperti apa gitu ya di home credit Indonesia eh yang pasti nanti teman-teman akan melalui rekrutmen proses di mana nanti rekrutmennya itu akan dilalui bersama eh HR interview dan juga user interview jadi nanti eh dari HR interview biasanya untuk eh apa namanya eh Fit eh culture fednya gitu ya dan juga eh minimum requirement dari kita sudah terpenuhi nanti teman-teman akan langsung ketemu dengan user yang akan menjadi mentornya langsung setelah itu nanti akan ada onboarding event di mana kita eh teman-teman akan dikasih eh pembekalan sedikit terkait dengan company profile sendiri kemudian eh apa namanya terkait dengan eh it security-nya dan hal lain-lainnya yang berkaitan dengan data protection karena betul nanti teman-teman ketika join itu akan terjun langsung nih kalau misalkan e menjadi analis ya akan mengerjakannya ya datanya data real dari eh companynya sendiri gitu ya jadi memang kita juga mengutamakan yang namanya data protection makanya itu e akan kita berikan di awal kemudian ada sesi trainingnya juga setiap bulan gitu ya soft skill and technical skill Eh kayak contohnya soft skill itu kemarin kita ada tentang building relationship kemudian juga ada eh tentang communication skill gitu ya dan Kalau teknikalnya kemarin kita sempat nih bawain juga tentang Microsoft Excel gitu ya eh apa namanya e eh apa namanya foundation gitu ya tools yang biasa kita pakai day to day tapi tenang aja di situ juga kita bagi dua ya ada yang basic skill gitu ya khususnya untuk teman-teman yang mungkin enggak berkecimpung di di Excel setiap hari tapi kok mungkin untuk yang level analis itu kita ada yang level intermediate di mana itu diajarkan langsung oleh tim Operation analis yang langsung kemudian kita juga ada survei main mentornya untuk eh apa ya eh health checking gitu ya gimana teman-teman Eh selama eh pertengahan program itu seperti e apa feedbacknya dan juga apa yang sudah didapat e both from MTI and mentornya kemudian eh during e setelah 4 setengah bulan berlangsung teman-teman akan mengelaksanakan final presentation Project Di mana Di situ kesempatan teman-teman untuk menunjukkan nih eh What you have done in four and a half month eh program eh di situ berbarengan dengan mentor dan juga dengan timnya dan juga juga ada offboarding event gitu ya Eh sebagai closing dari programnya eh yang akan diberikan juga eh CV and interview eh session dari tim HR eh as a part of preparation teman-teman terbang nih ke tempat lain atau mungkin bisa jadi dihire langsung eh oleh Home Credit gitu itu aja dari aku eh teman-teman semuanya jadi So if you guys interested e langsung aja apply ke eh apa namanya eh platform-nya eh bisa lalui LinkedIn kita gitu ya E atau langsung cari aja ke e website kampus merdekanya eh taipe aja home credit Indonesia di situ semuanya positionnya sudah ada gitu itu aja dari aku Bu terima kasih banyak Baik bu Sanya nanti mungkin saya itu kan juga adaink bisa dibuka eh Oke boleh ke sini aja langsung ya aku kirim apply nanti Bu usnya juga boleh send ke saya yang saya sudah kirim email dan kalau bisa langsung ke situ aja untuk langsung ke platform kampus merdekanya eh buanya suara saya kedengaran mungkin sebelum ditutup oleh Eh ibu mungkin ada yang mau bertanya dulu terkait dengan program internshipnya i Bu eh waktunya sudah habis dan Eh ibu saya sudahudah e drop eh email dan nomor telepon saya nanti Ibu e informasinya kasih ke saya aja jadi nanti ini memang sebagian bes mungkin anak-anak bisa ikut ini karena memang mereka ambil sebelumnya mikrokredensial ssinya mereka boleh magang ya Baik nanti informasinya kita akan bantu Karena untuk pembuatan surat dan lain-lain kita juga akan bantu Baik terima kasih untuk informasinya kasih Bu i ya Eh teman-teman silakan onc Kita akan ambil absennya teman-teman silakan oncam saya kasih 1 menit untuk mempersiapkan yang rapi yang bagus silakan nanti kita akan absen Oke saya mulai secara keseluruhan Kalau enggak salah ada lima ee Saya akan ambil absennya ee halaman pertama selanjutnya untuk yang kedua selanjutnya yang ketiga selanjutnya yang keempat Sebentar bentar ya keempat terus yang terakhir yang kelima Oke Baik ee terima kasih eh untuk Pak Yang sebes sebesar-besarnya ya Pak Gunawan dan Bu Sanya ee terus e mungkin juga mohon informasinya Bu sebenarnya di sini juga ada anak-anak yang siap direkrut untuk menjadi karyawan ya Eh nanti juga kalau ada informasinya Ibu boleh e sampaikan ke kita Nanti Mungkin eh saya bisa kontak Ibu juga ya nanti mungkin Ibu silakan e apa reply dari Eh nomor telepon yang saya sudah kasih Bu Eh terakhir terima kasih banyak Pak Gunawan semoga ini menjadi bekal juga untuk e anak-anak e persiapan mereka untuk ee menjadi ee mahasiswa yang lebih profesional dan siap untuk ee terjun ee di masyarakat Terima kasih Pak Gunawan ya sama-sama Ibu Oke Baik terima kasih selanjutnya saya kembalikan ke Bu Ajeng kalau ada yang mau disampaikan dan jangan lupa mahasiswa melakukan evaluasi ee dari ee apa em yang sudah ada di screen ini tadi silakan Terima kasih Pak basanya Terima kasih Bu izin semuanya sampai bertemu di event selanjutnya Thank you Baik Terima kasih Bu Ike sudah boleh meninggalkan ruangan Ya terima kasih Bu Ik Terima kasih Bu terima kasih Pak kasih Bu