Transcript for:
Pemahaman Analisis Regresi Linear

Assalamualaikum warahmatullahi wabarakatuh Pada video ini kita akan belajar tentang analisis regresi Ini merupakan video pertama dari 3 rangkaian materi tentang analisis regresi Agar lebih maksimal dalam memahami materi kali ini Yang pertama pertama pastikan Anda telah juga menonton atau mempelajari video tentang analisis korelasi kemudian persiapkan buku dan alat tulis untuk mencatat hal-hal penting dan juga hal-hal yang kurang dimengerti untuk selanjutnya saya persilahkan anda untuk bertanya melalui kolom komentar Baiklah Mari kita mulai pembahasannya perhatikan ilustrasi gambar berikut misalkan sebuah perusahaan brand hijab merk X ingin mengetahui seberapa efektif kah Instagram ads dalam meningkatkan banyak orderan dalam hal ini banyak orderan itu mewakili penjualan Tentu sangat penting bagi seorang pelaku usaha bahwa seberapa banyak modal yang dikeluarkan untuk biaya iklan itu akan meningkatkan penjualan mereka Oleh karenanya mari kita bahas ilustrasi kasus ini dalam sudut pandang analisis regresi Misalkan ini adalah data dari berbagai reseller produk hijab merek X yang melakukan promosi penjualannya melalui Instagram. Ini adalah data biaya Instagram Ads yang dikeluarkan. misalkan dalam ribu rupiah misalkan ini dalam seminggu kemudian ini adalah banyaknya orderan dalam satuan pcs dari data ini kita bisa visualisasikan melalui skater plot berikut bagi Anda yang telah mempelajari materi analis korelasi tentu sangat mudah menginterpretasikan gambar ini bahwa di sini terlihat adanya kecenderungan hubungan linear positif antara Instagram ads dengan banyaknya orderan. Hubungan linear positif ini apakah dapat juga mencerminkan seberapa besar peningkatan banyaknya orderan berdasarkan Instagram ads ini? Nah mari kita lihat menggunakan persamaan regresi linear. Jadi, pada intinya, pada regresi linear adalah kita ingin mencari garis lurus dengan persamaan Y sama dengan B0 plus B1X. Tentu akan banyak garis lurus yang dapat dibuat dari data ini, misalkan seperti ini, garis yang berwarna hitam, kemudian bisa juga garis yang berwarna pink, atau juga yang berwarna biru. Nah, misalkan dari... Dari ketiga garis ini, manakah yang paling mewakili titik-titik pengamatan ini? Jadi, pada regresi linier, garis lurus yang akan dicari adalah garis yang paling menggambarkan pola hubungan antara X dan Y. Yang manakah di antara ketiga garis ini? Atau mungkin ada garis lainnya yang paling pas menggambarkan hubungan antara Instagram ads dengan banyaknya orderan? Nah, tetap fokus perhatikan. bagaimana cara mencari garis lurus tersebut kita awali pembahasan ini dengan membahas tentang model regresi linear sederhana jadi kalau kita berbicara model regresi asumsinya kita sedang berbicara untuk populasi jadi ini model pada populasi adalah Y sama dengan beta 0 plus beta 1x plus epsilon dimana Y merupakan poubah atau variable tak bebas y sering juga disebut sebagai peubah atau variable respon. Kemudian beta 0 dan beta 1 adalah parameter regresi, di mana beta 0 merupakan intercept, beta 1 merupakan slope atau gradient, atau juga kemiringan. Sedangkan X merupakan peubah atau variable bebas, sering juga disebut sebagai prediktor, dan epsilon adalah galat atau error. Ini merupakan komponen error yang bisa jadi dia mengakomodir faktor-faktor lain yang turut mempengaruhi Y, namun tidak masuk ke dalam model. Karena pada model regresi ini kita sedang fokus kepada variable atau poubah X yang diduga mempengaruhi Y. Nah, faktanya kita sangat jarang sekali memiliki data Populasi, karena itu bentuk model regresi populasi ini dapat diturunkan ke dalam bentuk model regresi pada sampel, yaitu Y sama dengan B0 plus B1X plus B1X. di mana B0 dan B1 ini adalah penduga bagi beta 0 dan beta 1. Jadi B0 merupakan penduga bagi beta 0 dan B1 merupakan penduga bagi beta 1. Sedangkan E adalah sisaan atau residual Jadi pada data sampel yang tadinya error atau galat Ini kita namakan istilahnya dengan sisaan Bahasa Indonesia nya sisaan, bahasa Inggris nya residual Sedangkan E masih merupakan peubah bebas dan Y merupakan peubah tak bebas Karena B0 dan B1 ini adalah penduga bagi beta 0 dan beta 1 tentu b0 dan b1 ini dihitung berdasarkan data sampel yang kita miliki nah bagaimana mendapatkan nilai b0 dan b1 ini tetap fokus untuk mengikuti penjelasannya perhatikan dulu scatterplot ini misalkan garis yang berwarna pitch ini adalah garis regresi ya yang kita kita tulis persamaan garis ini sebagai Y duga sama dengan B0 plus B1X gitu ya. Nah kemudian misalkan ini kita ambil salah satu titik pengamatan ini adalah Y. Maka titik berwarna hitam adalah titik yang tepat persis pada garis regresi. Itu namanya Y duga yaitu nilai dugaan dari Y yang ini. Tentu pada gambar ini terlihat sekali bahwa Ada selisih atau ada jarak antara nilai Y sesungguhnya, ini dikatakan sebagai Y aktual, nilai pengamatan sesungguhnya, dengan Y dugaan. Ini adalah selisihnya yang berwarna ungu, dari sini ke sini. Nah selisih inilah yang dinamakan sebagai E atau error residual, atau bahasa Indonesia adalah sisaan. Jadi ini adalah besarnya sisaan untuk pengamatan yang ini katakanlah dia pengamatan 1 disini kemudian untuk pengamatan yang lain juga pasti ada sisaan-sisaannya ada error-errornya ya ini errornya kemudian ini errornya misalkan ini dinotasikan sebagai E1 maka ini kita bisa dapat E2 ini E3 gitu ya kemudian yang dari sini ke sini ini adalah E4 gitu ya kemudian ini E5 gitu dan seterusnya untuk setiap pengamatan kita memiliki error atau sisaan yang merupakan jarak antara nilai dugaan dengan nilai aktual dari y-nya nah sekarang pada persamaan y duga sama dengan b0 plus b1x ini lalu bagaimana menghitung b0 dan b1 ini prinsipnya adalah dan Dalam menentukan persamaan regresi kita akan mencari suatu garis lurus yang membuat jarak antara titik pengamatan Y dengan nilai dugaannya Y duga atau Y topi. Ini dibaca Y head atau Y topi adalah sekecil mungkin. Dalam hal ini berarti kita ingin mencari E error yang berbeda. yang paling kecil yang minimum karena itulah prinsip di dalam menduga parameter regresi atau mencari persamaan garis regresi ini adalah dengan meminimumkan jumlah kuadrat sisaan atau Sigma eikwadrat Nah kenapa ini dikuadratkan karena kita tahu bahwa eh itu bisa bernilai positif bisa negatif jadi Dalam hal ini, E itu merupakan Y min Y duga. Sehingga pada saat Y-nya lebih besar dari Y duga, nilai E positif. Pada saat Y lebih kecil dari Y duga, nilai E ini akan negatif. Sehingga yang akan diminimumkan adalah jumlah dari EI kuadrat. Metode seperti ini dikenal dengan istilah MKT. Metode kuadrat Nah, menggunakan konsep kalkulus sederhana, saat kita ingin meminimumkan jumlah kuadrat sisaan ini, maka diperolehlah nilai B1 seperti ini. Sigma per kawasan. kalian antara XI min X bar ini adalah rata-rata X dan ini adalah rata-rata Y dimana XI ini adalah nilai perubahan X untuk pengamatan ke I kita tahu tadi ya pengamatannya ada 1, 2, 3, 4, 5, 6, 7, 8 sampai n dibagi dengan sigma xi min x bar di kuadrat ini namanya jumlah hasil kali gitu ya yang bawah adalah jumlah kuadrat nah kemudian b0 nya ditentukan dengan y bar dikurang b1 dikali x bar Sebagai tambahan, untuk persamaan garis regresi ini, rumus B1 dapat diuraikan dari B1 yang tadi, merupakan pembagian antara jumlah hasil kali XI min X bar dengan YI. I min Y bar dibagi dengan jumlah kuadrat X I min X barnya setelah diuraikan ini akan menjadi seperti ini nah perhatikan bahwa ini sering dikenal dengan rumus hitung agar lebih lebih mudah melihat rumus ini sebenarnya yang ini kalau kita hilangkan notasi i1 sampai n-nya Anda bisa mudah mengingatnya dengan cara menyederhanakan penulisan rumus ini sigma xy min sigma xy per n itu terus dibagi dengan sigma x kuadrat dikurang dengan sigma x dikuadratkan dibagi dengan n selanjutnya setelah anda mendapatkan nilai b0 dan b1 hal yang lebih penting selanjutnya adalah menginterpretasi nilai B0 dan B1 nah apa interpretasi dari B0 dan B1 ini jadi B0 adalah nilai dugaan rata-rata Y ketika X bernilai 0 kita ingat kembali tadi bahwa persamaan regresinya adalah Y duga sama dengan B0 plus B1 X ya jadi b0 adalah nilai dugaan rata-rata y ketika X bernilai 0 jadi saat X nya sama dengan 0 maka ini menjadi nol sehingga y duga nya menjadi b0 naik Nah ini artinya adalah bahwa secara rata-rata Y akan bernilai sebesar B0 ketika X-nya 0. Nah dengan catatan bahwa B0 ini akan interpretable apabila yang pertama kondisinya nilai X sama dengan 0 itu memang faktanya dapat bernilai 0. Nah seperti apakah peubah X yang terakhir? Tidak mungkin bernilai 0. Misalkan kita ingin mengetahui pengaruh berat badan bayi terhadap tinggi badan bayi misalnya. Jadi X-nya adalah berat badan dan Y-nya adalah tinggi badan bayi. Nah berat badan bayi itu tidak mungkin bernilai 0. Sehingga B0 di sini tidak interpretable. Kemudian catatan yang kedua itu adalah pada data. Ini pada data. yang kita miliki nilai X sama dengan nol berada dalam selang pengamatan ya jadi jadi pada data yang kita miliki ini memang mengandung nilai nol maksudnya Oke ya jadi nilai b0 ini tidak selalu harus diinterpretasikan kemudian interpretasi dari b1 adalah nilai dugaan perubahan rata-rata y atau nilai harapan y jika X berubah 1 satuan artinya adalah secara rata-rata Y akan berubah sebesar B1 ketika X berubah 1 satuan, baiklah sekarang kita akan menghitung nilai B1 berdasarkan rumus ini langsung menggunakan Excel secara manual, kita tahu bahwa disini adalah kita butuh X1 min X bar YI min Y bar, kemudian XI min X bar kuadrat tentu kita harus menyiapkan kebutuhan ini masing-masing di dalam satu kolom ini adalah xi min x bar ini yi min yi bar ini xi min x bar dikali yi min yi bar kemudian ini adalah x min x bar kuadrat gitu ya tentu pertama kali kita harus menghitung x bar nah seperti apa menghitung x bar? disini average silahkan disorot data x kita coba lihat ini rumusnya muncul disini overage B2 sampai B21 ini B baris kedua sampai B baris kedua satu untuk di sel sebelahnya kita tinggal copy dengan cara menarik seperti ini kita lihat ini rumusnya sudah average C2 sampai C21 nah disini kita sediakan juga sel untuk jumlah untuk mengetahui karena nanti sekalian kita bisa menarik nilai jumlah ini untuk setiap kolom-kolom yang kita butuhkan rumusnya adalah sum Nah sebelum kita menentukan nilai jumlah-jumlah di setiap kolom, kita boleh isi dulu kolom-kolomnya ini isinya apa. Selanjutnya xi min x bar itu berarti sama dengan ini xi nya dikurang dengan x bar. Kita beri tanda dolar karena mau ditarik ke bawah ya biar tidak berubah. Yang ini tidak. I min Y bar memberi tanda dolar adalah dengan menekan tombol F4 pada keyboard kemudian enter oke, nah sekarang kita kalikan ini kemudian X I min X bar ini dikuadratkan Nah kita butuh jumlah dari dua kolom terakhir ini Jadi kita copy rumus sumnya disini Nah udah dapat Baiklah nah sekarang kita masukkan ke rumus B1 Sama dengan sigma XI-X bar dikali YI-Y bar adalah yang ini nilainya sama dengan 568901 per Sigma XI min X bar kuadrat yang ini nilainya 2291 80 jika dihitung nilainya adalah sama dengan 2,5 selanjutnya kita hitung B0 B0 adalah Y bar min B1 X bar ini adalah Y bar ini adalah X bar jadi ini adalah 403,05 dikurangi 2,5 dikali 159 sama dengan Jadi, persamaan garis regresi yang diperoleh adalah Y2 sama dengan 8,36. ditambah 2,5x atau dugaan orderan itu sama dengan 8,36 ditambah 2,5 biaya instagram ads apa interpretasi dari B0 dan B1 ini B0 sebesar 8,36 artinya secara rata-rata reseller hijab merek ABC akan mendapatkan orderan sebanyak 8,36 pcs ini kalau dibulatkan sekitar 8 pcs ketika reseller tersebut tidak memasang iklan melalui Instagram ad artinya pada saat X sama dengan 0 sedangkan B1 sama dengan 2,5 artinya secara rata-rata banyaknya orderan produk hijab merk ABC akan meningkat sebesar 2,5 pcs atau sekitar 2-3 pcs ya makna 2,5 ini ketika reseller tersebut menambah biaya Instagram ads sebesar Rp1.000 disini Rp1.000 karena satuan dari angka di variable biaya Instagram ads adalah Rp1.000 selanjutnya saya akan menambahkan informasi informasi bahwa dalam menentukan persamaan garis regresi ini bisa juga langsung melalui menu Excel itu ya jadi kita bisa memunculkan persamaan garis regresi langsung di scatterplot menggunakan Microsoft Excel jadi hasilnya nanti akan seperti ini ya caranya adalah kita klik gambar scatter plotnya kita klik tanda tambah kemudian trendlinenya di checklist nah muncul ini garis regresinya kemudian memunculkan persamaannya adalah more optionnya di klik Kemudian display equation on chart. Nah, ketemulah persamaan ini. Mudah sekali kan? Oleh Excel, persamaan regresinya yang dimunculkan adalah B1 dulu. Jadi ini adalah B1-nya. ini adalah D0 perbedaan angka yang kita peroleh tadi ini kan sekitar 2,5 hanya perbedaan pembulatan saja ini 8,36 ya yang kita peroleh tadi nah kira-kira demikianlah pembahasan mengenai bagaimana menduga persamaan garis regresi berdasarkan data sampel yang kita peroleh jadi kompetensi yang harus Anda kuasai pada topik ini adalah bagaimana Anda menentukan persamaan regresi artinya bagaimana Anda menentukan nilai B0 dan B1 kemudian yang kedua adalah bagaimana menginterpretasikan persamaan regresi yang sudah diperoleh silakan istirahat dulu tarik nafas panjang silakan ambil air minum dan stretching-stretching siap-siap lanjut untuk menonton video bagian kedua selamat menikmati Terima kasih.