Transcript for:
Pendugaan dan Pengujian Model Ekonometrika

Assalamu'alaikum warahmatullahi wabarakatuh. Salam sejahtera bagi kita semua. Perkenalkan, nama saya Baman Juwanda dari Departemen Ilmu Ekonomi, Fakultas Ekonomi dan Manajemen IPB. Kali ini saya ingin sharing tentang pendugaan dan pengujian model.

Ini merupakan salah satu topik yang sangat pendasar dalam econometric modeling. Dan ini ada di buku saya, Econometrika, Pemodelan dan Pendugaan. Untuk membahas ini, diasumsikan Anda sudah memahami dalam video pertama saya terkait dengan pengantar ekonometrik, yaitu bagaimana tahapan pemodelan, kemudian juga tujuan pemodelan itu untuk apa, kemudian ada beberapa pola hubungannya, di mana diantaranya ada hubungan langsung, ada indirect relationship, tidak langsung, aditif, multiplikatif.

Ada interdependent relationship, ini ada kepersamaan simultan. Ada juga yang namanya superior relationship. Ini sebagai dasar model apa yang akan kita kembangkan, semuanya ini tergantung daripada pola hubungannya di antara variable-variable tersebut.

Baik, tentang pendugaan dan pengujian model, kita harus memahami dulu bahwa model yang kita akan duduk-duga ini sebenarnya merupakan perumusan dari suatu masalah. Jadi merupakan absaksi dari suatu masalah atau realitas yang diungkapkan dalam suatu persamaan matematik. Model ekonometrika adalah model statistik yang mencakup nilai error.

Jadi misalkan saja ini adalah data aktual, diduga dalam suatu persamaan. Kemudian tentu saja dugaan ini tidak persisama sehingga ada simpangan disebut error, kadang-kadang juga disebut sisaan. Kemudian dugaan ini karena sudah dalam bentuk fungsi model matematik yang sudah tertentu, tentu saja ini komponen yang sistematik. Sedangkan error ini harus non-sistematik, harus random, tidak berpola, kadang-kadang juga disebut sebagai white noise error.

Nah, diharapkan unsur-unsur ketidakteraturan Y ini dapat dijelaskan oleh nilai X1, X2, dan XP dalam suatu... model dugaan di dalam persamaan dua-dua ini oleh karenanya komponen sisaan ini dirisakan sekecil mungkin. Nah, kenapa ada error atau sisaan?

Nah, ini bisa saja berasal dari beberapa sumber. Pertama, kemungkinan ada kesalahan pengukuran, ada measurement error. Bisa juga ada kesalahan proxy yang kita gunakan di dalam model ini, baik dalam variable Y maupun variable X.

Kemudian bisa saja error ini bersumber dari bentuk fungsi. Bisa saja yang kita gunakan modelnya salah. Kemudian yang ketiga, bisa saja ada variable yang relevan, tapi karena satu hal, misalkan saja datanya mahal atau mungkin datanya tidak ditemukan, jadi di sini ada omitted relevant variable.

Dan ini merupakan juga salah satu sumber daripada error. Bisa juga ada pengaruh faktor lain yang belum terpikirkan. Katakanlah sekarang ini ada kejadian tiba-tiba terkait dengan wabah COVID-19. Itu juga merupakan faktor-faktor yang belum terpikirkan sebelumnya.

Sebagai ilustrasi nanti, dan komponen error ini sebenarnya digunakan dalam seni mengembangkan model. Jadi misalkan saja kita usahakan error ini sekecil mungkin. Jadi kesalahan pengukuran, kesalahan proksi sekecil mungkin sehingga kita mendapatkan model dengan error yang sangat kecil.

Sebagai ilustrasi, ini ada data permintaan produk deterjen baru selama 30 minggu terakhir. Dipasarkan pertama kali beserta faktor-faktor yang diperkirakan mempengaruhinya. Misalkan harganya, harga pesaing, biaya iklan yang dikeluarkan, daya beli masyarakat. Kita ingin menduga. suatu model permintaannya.

Misalkan saja model permintaannya dalam bentuk seperti ini. Jadi biasanya kalau yang namanya model populasi, ini merupakan model yang biasanya ditulis, parameter coefficient modelnya dituliskan dengan Greek letter. Kemudian kalau kita menduga dari data contoh atau model sampel, biasanya dituliskan dalam bentuk Greek letter yang dikasih head, dugaannya, atau mungkin langsung ke huruf biasa, atau Arabic letter biasa.

Nah, untuk Y ini adalah disebut sebagai dependent variable, ya. Ini tidak bebas, tergantung daripada nilai X, sedangkan X ini adalah independent variable, pembawa bebas. Dan karena ini menjelaskan, kadang-kadang juga disebut explanatory variables.

Dan Y ini merupakan respon, merespon nilai X, kadang-kadang juga disebut... Respond variable. Dalam hubungan sebab-akibat, ini adalah pubah akibat, ini adalah pubah penyebabnya. Dalam meramal, kadang-kadang kenapa ini diramal? Bisa saja karena Y ini sangat sulit atau mahal diukurnya, sehingga bisa diduga dari nilai-nilai yang relatif mudah atau murah diukurnya.

Sebelum kita membahas lebih lanjut, jadi di sini ini adalah koefisiennya, ini adalah koefisien populasi, ini adalah interceptnya, kemudian random error. Sebelum membahas tadi model regresi berganda ini, multiple regression model ini, mungkin barangkali kita bahas dulu model yang lebih sederhana, yaitu hanya dua variable saja. Misalkan saja dalam konteks ini, kita melihat dua variable hanya permintaan dengan harga. Hanya permintaan dengan harga ada dua variable.

Jadi misalkan saja kita ungkapkan dalam suatu simple linear regression model seperti ini. Kemudian, Ini hanya dua variable saja. Kemudian, katakalah modelnya, kalau kita lihat misalkan model ini di dalam data misalkan saja, sebelum kita bahas lebih detail, ini adalah data pengamatan.

Kalau kita buat scatter plot, ini data pengamatan, kemudian ini adalah nilai dugaan, dan ini disebut sebagai... Rata-rata Y untuk X tertentu, ini adalah rata-ratanya. Kemudian ini adalah error, ini adalah dugaan. Jadi kalau dugaan dengan nilai sebenarnya ini, ini adalah tadi simpangan.

Atau kadang-kadang juga disebut error. Nah, bagaimana menduga koefisien? Koefisien slope dan intercept ini, model penduga yang umum yang awal dibahas biasanya ini menggunakan model ORA. metode pendugaan OLS atau Ordinary Least Square, yaitu metode jumlah kuadrat sisaan terkecil.

Jadi di sini mencari dugaan koefisien A dan B ini yang menghasilkan jumlah kuadrat simpangan antara kedua data aktual dengan data dugaan ini minimum. Jadi ini adalah jumlah sisaan, ini sisaan, kemudian dikuadratkan kita jumlahkan berapa A dan B supaya nilainya minimum. Dan ini bisa ditunjukkan A dan B itu adalah rumusnya seperti ini.

Nah, untuk sekarang sudah banyak software, untuk data yang tadi, jadi duga misalkan saja dengan hasil dugaan dari suatu software setata, ini adalah nilai dugaannya, ini profesianya, ini intercept, ini adalah slope, ini modelnya. Kemudian untuk menduga apakah signifikan atau tidak, ini dari nilai P, ini sudah dibahas di video pertama saya. Jadi untuk menguji, bahkan sebenarnya bisa saja melihat daripada...

selang kepercayaannya. Artinya kalau profesi slope daripada variable P ini adalah bahwa jika katakanlah harga naik 1 dolar, maka permintaan ini turun antara 3 sampai dengan 7. Jadi kalau misalkan saja nilai 0 tidak dicatup dalam selang kepercayaannya ini, berarti kita terima H1, bahwa profesianya ini tidak sama dengan 0. Artinya harga ini mempengaruhi permintaan. Ini defaultnya, default dalam suatu software. Software apapun biasanya defaultnya, hipotesis statistiknya adalah beta sama dengan 0, beta tidak sama dengan 0. Tentu saja dalam praktek itu tidak harus sama dengan 0, bisa saja sama dengan suatu konsultan.

Nanti kita bahas. Nah, untuk menguji apakah signifikan atau tidak, sebenarnya kita lihat dulu dasar, ada yang namanya Dalil Gauss-Markov. Jadi kita mengasumsikan data ini, misalkan ini adalah X, ini adalah Y, kemudian katakan ini adalah garis dugaannya.

Untuk X1 nilainya ini bervariasi. Untuk X2 ini juga bervariasi, tapi variasinya ini sama untuk X1, X2, dan seterusnya. Jadi nilai Y ini menyebar normal di sekitar garis digresi.

Untuk masing-masing nilai X, baik X1 dan X2 ini, sebaran atau ragam sekitar regresi ini adalah sama. Inilah kita namakan asumsi kehomogenan, kemudian juga kebebasan artinya baik X1 ini naik atau turun, ini sebaran Y-nya relatif sama. Kalau misalkan saja asumsinya dipenuhi, maka dugaan kita bersifat glue, base linear unbiased estimator, yaitu penduga tabias linear. terbaik, yaitu maksudnya ragamnya adalah yang minimum.

Inilah yang namanya dalil Gosmarkov. Jadi kalau ini dipenuhi asumsinya maka dugaan kita ini bersifat Blue. Nah asumsi mode regresi linear ini, jadi tadi dilihat bahwa ini adalah kenormalan dan kebebasan, jadi nilai Y menyebar normal untuk masing-masing nilai X dengan nilai tengah yang tadi kita sampaikan, alpha plus beta X, ini merupakan duganya ragamnya sama, kemudian juga sebaran peluang error ini adalah sama juga sama dengan Y tadi normal, bebas dan indesik dengan nilai tengah 0, dan ragamnya semuanya sama, homogen.

Kemudian Variable X dan error ini harus bebas. Tidak ada korelasi. Kalau ada korelasi ini berarti nanti ada kaitannya dengan persamaan simultan. Artinya X ini kemungkinan dipengaruhi oleh faktor lain.

Kemudian kehomogenan, ragamnya konstan. Tadi sudah kita lihat gambarnya. Kemudian error ini bebas.

Tidak ada auto korelasi. Dugaan galat baku dihitung seperti biasa kalau kita menduga ini ada errornya. Dikuadratkan, dijumlahkan, kemudian dibagi n-2. Kenapa dikurangi 2? Karena kita menduga 2 parameter koefisien.

Kalau parameter koefisiennya ada sebanyak b, ini dibagi n-b. Kalau asumsi tentang variable at-sak tadi, error tadi dipenuhi, homogen, tidak ada autoporelasi, maka masing-masing dugaan koefisien, baik intercept maupun slope, ini juga akan menyebar normal. Jadi misalkan saja B0 dan beta 1 ini dugaannya ini menyebar normal. Dan nilai tengahnya ini persis di nilai populasinya.

Ini merupakan pendugaan tabias. Jadi jika asumsinya dipenuhi, maka dugaan daripada parameter koefisien digresi nilai tengahnya sama. Jadi artinya rata-rata dari semua kemungkinan nilai dugaan itu, karena kita kan ngambil sampel.

Tiap sampel bisa saja kita dapatkan dugaan yang berbeda, namun rata-rata dari semua kemungkinan dugaan itu sama dengan nilai sebenarnya. Inilah yang kita kenal dengan tak bias, unbiased estimator. Dan ini adalah nilainya, jadi nanti ini ragam daripada interceptnya adalah ini, ini ragam daripada slope-nya, ini adalah standar error daripada slope-nya.

Nah ini digunakan untuk menguji dari koefisien itu. Sekali lagi ya, kita ulangi tentang gauss. Markov, dari Gaikos-Markov theorem.

Jadi error ini dia menyebar normal dengan nilai tengah 0 dan ragam sigma kuadrat sama saja untuk i sama dengan 1 sampai dengan n. Artinya antara error yang satu dengan error yang lain bebas atau korelasinya sama dengan 0 atau tidak ada atau korelasi. Kemudian homogen karena juga disebut homoskedasticity, jadi varian error ini sama. Untuk semua i, i dari 1 sampai dengan n.

Kemudian jangan lupa x ini adalah fixed variable. Di sini ditetapkan, predetermined variable, ditetapkan lebih dulu. Bukan merupakan random variable. Berbeda kalau misalkan x itu ternyata dipengaruhi oleh faktor lain juga. Itu nanti dibahas di dalam persamaan simultan.

Nah, dugaan koefisien dengan metode OLS akan bersifat tak bias. dengan ragam minimum, kita kenal dengan blue base linear unbiased estimator, kalau asumsi ini dipenuhi. Kalau asumsi ini dipenuhi, maka dugaan rasa-rasa Y-nya untuk X tertentu, ini juga akan menyebar normal.

Misalkan rasa-rasa Y untuk X ini akan menyebar normal. Dengan nilai tengah, sama dengan nilai dugaannya, kemudian ragamnya adalah ragam rata-rata. Begitu juga untuk dugaan individu.

Jadi individu juga akan menyebar normal. Tentu saja untuk individu ini, ragamnya relatif lebih besar. Jadi kalau menduga individu, kemungkinan ragamnya lebih besar dibandingkan untuk menduga rata-rata Y untuk X tertentu.

Nah, ini dugaannya sama, tapi ragamnya ini berbeda. Untuk individu, relatif lebih besar. Dan ini yang tadi kita kenal dengan namanya Delil Gauss-Markov. Jadi kalau ini dipenuhi, maka dugaannya bersifat. blue.

Nah dugaan selang nilai ramalan ya untuk rata-rata Y ya jika X tertentu diketahui maka selang kepercayaannya adalah dugaan Y plus minus nilai T tabel dikali dengan simpangan baku daripada rata-rata Y tadi ya. Nah ini standar errornya kemudian ini adalah nilai T-nya tadi dan ini Berbeda dengan untuk rata-rata. Kalau kita lihat ragam ini paling kecil ketika XI-nya sama dengan X rata-rata.

Jadi kalau XI sama dengan X rata-rata ini akan sama dengan 0 dan ragamnya adalah yang paling kecil. kecil. Artinya, kalau X ini lebih jauh atau makin jauh dari rata-rata pengamatan, rata-rata pengamatan X di sini, maka ragamnya makin besar dan selang kepercayaannya juga makin besar. Nah, sedangkan selang kepercayaan bagi dugaan respon individu, jadi kalau tadi ini adalah untuk rata-rata, untuk individu ini ragamnya lebih besar, seperti tadi disampaikan di dalam gambar, lebih besar di sini, jadi tambahan satu ini membuat selangnya lebih besar.

Nah ini banyak software untuk menentukan selang kepercayaan ini. Jadi misalkan kalau kita lihat untuk selang kepercayaan rata-rata Y untuk X tertentu, ini adalah seperti ini. Sedangkan selang kepercayaan untuk individu Y, ini lebih lebar.

Kita lihat selang yang paling kecil, yang paling sempit adalah ketika X sama dengan rata-rata pengamatan. Makin jauh daripada rata-rata X pengamatan di sini, rata-rata X yang diamati ini, maka selang kepercayaannya makin lebar, artinya makin kurang reliable, kurang bisa diindalkan. Seperti kata-kata kita mau memforkas jauh ke depannya, pasti kemungkinan salahnya juga makin besar. Dan ini ditunjukkan dari selang kepercayaannya.

Nah ini data yang tadi, data 30, ini adalah harga, kemudian ini adalah Verticalnya adalah permintaan, jadi kalau kita plot ini hubungannya negatif dan ini adalah garis regresinya. Nah dengan persamaan tadi untuk menduga selang kepercayaan rata-rata dan individu, jadi ini adalah selang kepercayaan untuk rata-rata lebih sempit dan yang ini adalah selang kepercayaan untuk individu. Ini mudah banyak software yang bisa membantu untuk menghitung selang kepercayaan ini. Begitu juga misalkan saja untuk contoh lain, kita mau peramal. Untuk data, misalkan saja kita lihat untuk data permintaan dengan minggu ke-1 sampai ke-30.

Kita mau melihat minggu ke-depan, minggu ke-31 dan seterusnya, bagaimana permintaannya. Kita ingin meramal, kata-kata. Jadi kalau kita misalkan ingin meramal dengan model sederhana ini, nah ini untuk... Minggu ke-1 sampai minggu ke-30, ini adalah permintaan, ini ramalannya. Jadi kalau kita lihat ini, kalau untuk rata-ratanya, pas di tengahnya ini adalah selangka perasaan yang paling kecil.

Sedangkan kalau makin jauh dari rata-rata, makin besar, di sini juga makin besar. Ini adalah selangka perasaan untuk rata-ratanya. Ini adalah selangka perasaan untuk individu Y, makin kurang diandalkan untuk menduga daripada individu.

Jadi kalau kita ingin meramal minggu ke-31... Ini makin kurang reliable ya, yang akan ditunjukkan bahwa selangkah persaingan ini makin lebar. Nah, untuk data yang lengkap kita pakai semuanya ya, jadi kita misalkan saja mau menduga nih, buatlah model permintaan ya, permintaan diduga dari harga, harga pesaing, biaya iklan, dan income ya. Untuk menduga model ini, kata kalian dengan model regresi seperti ini, multiple regression, kemudian kita bagaimana menentukan rumusnya, menduga nilai koefisien daripada B1, B2, B3, sampai B6 tadi. Nah ini sebenarnya saya ingin sampaikan, ingin kenalkan bagaimana pendekatan matrik supaya lebih sederhana.

Jadi kalau kita gunakan matrik, data ini adalah Vector Y, data Y dari minggu ke-1 sampai minggu ke-30, ini X-nya, ini X-1, X-2, X-3, X-4, dan seterusnya. Ini adalah untuk intercept. Kemudian kata-kata ini adalah transpose daripada matrix X kali X ini.

Kemudian setelah digandakan kita cari invest-nya. Kemudian ini adalah matrix X transpose dikali dengan Y. Dugaan OLS adalah rumusnya seperti ini.

Jadi invest daripada... Perkalian matriks X aksen X dikali perkalian matriks X aksen Y. Nah ini dugaan OLS. Artinya mau variabelnya ada 2, 3, 4, bahkan 10 pun rumusnya ini tetap sama. Nah untuk menduga apakah signifikan atau tidak, tentunya kita harus tahu berapa ragam daripada masing-masing dugaan ini.

Nah ragam dari masing-masing dugaan bisa dihitung dari rumus ini. Jadi tadi... Invest daripada matriks transpose X dengan X perkaliannya, kemudian kali dari dugaan ragam daripada error tadi. Jadi di sini, di dalam unsur diagonalnya, ini adalah ragam daripada interceptnya, yang ini adalah untuk yang variable kesatunya. Kedua, ketiga, keempat, dan seterusnya.

Jadi diagonal itu adalah ragam daripada parameter koefisiennya. Jadi ini kalau misalkan saja kita lihat, ragam tadi, standar error itu adalah akar daripada ragamnya tadi. Ini ditampilkan di sini, di dalam output software. Misalkan ini dalam startup.

Kemudian biasanya output ini, kita menginterpretasikannya adalah pertama, Apakah model dapat menjelaskan keragaman permintaan produk ini? Ini kan kita mau menduga bagaimana keragaman dari permintaan ini berdasarkan model tadi. Nah untuk menjawab apakah dapat menjelaskan keragaman permintaan produk itu, ini dari uji F, jadi lihat saja dari p-value-nya. Kalau p-nya kecil, ya berarti model ini dapat menjelaskan keragaman permintaan produk.

Atau minimal ada satu faktor yang mempengaruhi. Yang mana yang mempengaruhi, faktor mana yang mempengaruhi, langsung kita lihat dari uji T-nya. Yang ini P-value ini. Jadi kalau P-nya kecil, berarti ini adalah signifikan. Karena ini ketiga semua, kecuali mungkin untuk yang T ini.

T ini adalah minggu ke-1, minggu ke-2 kita ingin melihat apakah ada kenaikan tiap minggu. Jadi mungkin ini merepresentasikan awareness daripada... masyarakat terhadap produk yang baru diintrodusi ini. Apakah ada kenaikan tiap minggu?

Kelihatannya nilai P-nya adalah 0,095. Artinya, kalau kita menyimpulkan bahwa ini berpengaruh, awareness ini bisa saja salah dengan tingkat kesalahan 9,5%. Nanti kita bahas lebih lanjut ini. Untuk menguji Juni, biasanya sebenarnya bisa saja langsung daripada selangka percayaannya. Jadi kalau selangka percayaannya ini tidak mencakup 0, kata kalian ini semua tidak mencakup 0 kecuali ini.

Bayangkan kalau ini kita interpretasikan profesinya ini antara minus 0,2 sampai 2. Artinya bisa negatif, bisa positif. Artinya biasanya kita langsung menyimpulkan ini tidak signifikan. Tapi kita lihat ya bagaimana kita menghadapi p-value yang nilainya tidak terlalu besar sebenarnya. Nanti kita lihat bahas di berikutnya. Kita lihat.

bagaimana detailnya menjelaskan ini, yang dua permasalahan ini, yaitu tentang apakah model dapat menjelaskan keragaman Y, kemudian faktor apa saja yang mempengaruhi permintaan produk tersebut. Pertama, kita mau melihat uji model secara keseluruhan. Ini adalah model, ini nilai Y, ini adalah dugaannya, ini adalah error. Y ini beragam, katakan ini ragam Y, kemudian diduga dari model, ini juga ada ragam model, katakan ini ragam didesi, ini adalah ragam.

Error. Apakah model dapat menjelaskan keragaman Y? Jadi kita buat suatu hipotesis statistik.

H0 ini model tidak dapat menjelaskan keragaman Y. Kemudian H1 model dapat menjelaskan keragaman Y. Jadi ini sebenarnya masalah keragaman ya, uji F ini ya. Namanya juga ANOVA, Analysis of Variant. Kalau misalkan saja tidak dapat menjelaskan keragaman Y, artinya ragam regresi ini sama saja dengan ragam error.

Ini sama. Atau rasionya sama dengan 1. Kalau dapat menjelaskan keragaman Y, berarti ragam regression ini lebih besar daripada ragam error. Ini lebih besar atau rasionya lebih besar dari 1. Nah, ini sebenarnya penjelasan daripada analisis of variance. Kemudian, kalau misalkan saja model tidak dapat menjelaskan keragaman Y, Artinya X1 ini berubah, tidak merubah, Y, X2 berubah, tidak merubah, Y, dan seterusnya.

Artinya semua koefisien ini sama dengan 0. Artinya tidak dapat menjelaskan. Jadi sebenarnya semua koefisien sama dengan 0 ini adalah implikasi dari sini. Tapi banyak penjelasan langsung ke sini. Tapi sebenarnya dasarnya ini.

Ini hanya implikasi daripada penjelasan yang sebelumnya ini. Jadi H0 ini adalah... bahwa kalau model tidak dapat menjelaskan keragaman, artinya semua koefisien slope ini sama dengan 0. Sedangkan kalau model ini dapat menjelaskan keragaman, berarti kemungkinan bisa saja dari X1, bisa saja dari X2, bisa saja dari XB.

Atau dengan kata lain, berarti minimal ada koefisien yang tidak sama dengan 0. Atau minimal ada variable bebas yang bisa mempengaruhi Y. Untuk menguji ini, apakah model ini dapat atau tidak dapat menjelaskan keragaman Y, karena ini dari rasio dari dua ragam, kita menggunakan statistik uji F. Jadi, ragam regresi dibagi ragam sisa.

Ini menyebar menurut sebaran F. Jadi, di sini H1-nya ini lebih besar, berarti ini yang daerah kuning yang sebelah kanan, ini daerah H1, ini daerah H0. Kemudian kalau kita lihat ya, contoh yang tadi ya, jadi misalkan orang-orang biasanya langsung saja sama dengan 0 saja, padahal ini sebenarnya dari rasio dari dua ragam. Jadi ini adalah sebaran F-nya, kita lihat ya, dengan derajat bebas karena ada 5 variable, kemudian 5 variable bebas, kemudian derajat bebasnya 24, 1 itu adalah untuk intercept ya, kemudian kita lihat statistik uji F, nilai 51, berarti 51 ini adalah lebih besar daripada nilai tabel ya.

Kemudian di dalam software biasanya akan dikeluarkan P. P ini adalah kesalahan yang kita terima kalau kita menyimpulkan H1. Jadi kalau misalkan P-nya ini kecil, kita simpulkan H1 ya.

Jadi keputusannya adalah H1 ya pada taraf alpha 5% ya. Jadi alpha ini adalah semacam kesalahan maksimum yang masih bisa ditolerir. Kalau misalkan kesalahan yang Ada adalah P-nya lebih kecil daripada kesalahan maksimumnya, berarti kita berani menyimpulkan H1.

Jadi kesimpulannya adalah model dapat menjelaskan keragaman Y atau minimal ada satu variable bebas, yaitu X, minimal satu X, yang mempengaruhi Y. Yang mana yang mempengaruhi Y adalah kita lanjutkan dengan uji T. Sebelum ke uji T, kita lihat tadi ini adalah ragam.

Y-nya dari jumlah kuadrat ini adalah ragam daripada regresi, dari jumlah kuadrat regresi ini adalah ragam dari sisaan. Jadi kita mengenal ada yang namanya coefficient determinasi yaitu sum square of regression dibagi dengan sum square of total. Sum square total di sini. Jadi ini adalah coefficient determinasi. Ini mengukur proporsi keragaman yang dijelaskan oleh model.

Jadi ini secara informal bisa digunakan sebagai ukuran. goodness of it, untuk membandingkan validitas beberapa spesifikasi model. Jadi kalau R kuadratnya 91,5%, artinya 91,5% keragaman permintaan dapat dijelaskan oleh model, dan ini signifikan dari uji F-nya. Nah, tadi setelah kita sibukkan minimal ada satu faktor yang mempengaruhi, yang mana kita lihat masing-masing uji T.

Misalkan, apakah harga berpengaruhnya tak terhadap permintaan deterjen? Kita lihat. ini H0-nya adalah sama dengan 0, ini tidak sama dengan 0, kemudian kita lihat ujinya, uji T-nya adalah minus 11, yang minus 11 ini adalah daerah sebelah kiri, daerah kuning ini berarti jatuh di H1 atau tolak H0.

Kemudian biasanya kita kalau menggunakan software, nggak usah lihat tabel, langsung saja gunakan p-value, karena kalau kita menyimpulkan H1, kesalahannya sangat kecil, berarti kita putuskan H1 atau tolak H0. Kita kesimpulkan terbukti nyata bahwa pengaluh harga ini signifikan terhadap permintaan detergen. Nah, di dalam uji statistik sebenarnya tidak harus sama dengan 0 saja. Di dalam statistik ini sebenarnya tergantung daripada hipotesis penelitiannya. Hipotesis penelitiannya seperti apa?

Kalau misalkan saja hanya signifikan tidak signifikan berarti... profesi nya sama dengan 0 dan tidak sama dengan 0. Misalkan saja seperti ini. Sama dengan 0 atau tidak sama dengan 0. Tapi dalam praktek, bisa saja yang namanya signifikan itu bukan 0. Misalkan saja katakanlah jika harga naik, diturunkan 1 dolar, misalkan permintaan ini harusnya yang namanya signifikan, minimal 2 misalkan. Berarti di sini k-nya harus 2. Jadi tergantung permasalahannya.

Jadi bukan masalah. statistik, uji statistik itu selalu sama dengan 0. Bukan, sama dengan 0 itu adalah defaultnya daripada setiap software statistik atau software ekonometrika. Jadi ini adalah daerah kritisnya, daerah penolakan H0.

Jadi ini adalah H1, kalau uji duwi arah, two-way test di sini. Tapi dalam praktek bisa saja ada uji one-way, eka arah. Misalkan saja di sini profesianya ini kurang dari K.

Kalau kurang dari K, lihat H1-nya. Kalau kurang berarti daerah penolakannya adalah sebelah kiri. Bisa juga H1-nya adalah sebelah kanan. Itu lebih besar dari K. Poinnya di sini, yang namanya H0 itu selalu dalam bentuk sama dengan.

Bisa sama dengan K, bisa juga maksimum K, lebih kecil atau sama dengan. Bisa saja minimum K, artinya sama dengan atau lebih besar. Nanti di dalam uji eka arah, kita bisa langsung dari p-value-nya saja. Lihat, kalau uji eka arah bisa saja langsung dari setengahnya.

Kita lihat nanti contohnya. Misalkan saja untuk uji eka arah, apakah ada kenaikan permintaan tiap minggu? Jadi kalau misalkan kita lihat tadi, Datanya kan sebenarnya nggak signifikan. Jadi kalau misalkan kita lihat data, jadi kalau misalkan kita lihat datanya, kita lihat di sini, yang tidak signifikan ini kan adalah yang T ini.

Jadi kalau misalkan saja ada kenaikan, ada tiap minggu, apakah ada kenaikan atau tidak, ternyata nilai p-value-nya 9,5% dan ini lebih besar daripada 5%, berarti kemungkinan ini adalah tidak signifikan. Nah, kita lihat kalau misalkan saja asumsi atau mungkin hipotesis yang kita ingin uji ini adalah apakah ada kenaikan, misalkan pernyatanya gini, bukan masalah signifikan atau tidak, tapi Lebih spesifik, jadi di dalam metode penelitian, ketika kita menulis hipotesis penelitian itu harus lebih spesifik. Bukan hanya sekedar berpengaruh nyata.

Misalkan tadi dalam konteks ini, katakanlah hipotesis penelitiannya, apakah ada kenaikan permintaan tiap minggu. Kemudian kita uji dengan taraf nyata 5%. Jadi hipotesis penelitiannya ini adalah ada kenaikan permintaan tiap minggu. Kalau ada kenaikan permintaan tiap minggu, berarti hipotesis statistiknya, ada kenaikan permintaan tiap minggu kan berarti koefisienya ini lebih besar.

Dan tidak mengandung sama dengan. Kalau lebih besar, berarti di sini masuk ke H1. Jadi rule of thumb-nya, kalau pernyataan hipotesis penelitian ini mengandung sama dengan sebagai H0, kalau tidak mengandung sama dengan, dalam hal ini kan ada kenaikan.

Kenaikan itu lebih besar. Berarti ini sebagai H0. Kalau ini lebih besar berarti H0-nya tinggal kebalikannya saja. Ini adalah kalau lebih besar ini lebih kecil atau sama dengan.

Sebenarnya yang diuji adalah yang sama dengan 0-nya. Kemudian kalau kita lihat bagaimana tabel T di sini, karena ini lebih besar, maksudnya ini harus di daerah sebelah kanan kalau signifikan. Kemudian dari uji T, 1,74 ini lebih besar daripada 1,708, berarti signifikan.

Atau sebenarnya bisa kita lihat dari p-value-nya. Jadi kalau tadi uji dui arah, itu nilai p-value-nya adalah 9,5%. Jadi kalau kita menggunakan alpha 5%, ini tidak signifikan. Tapi kalau kita menggunakan hipotesis penelitiannya ini adalah ada kenaikan, berarti ini didukung dari data ini.

Dan nilainya, p-nya 0,045 itu sekitar setengahnya daripada 9,5% tadi. Sehingga kalau hipotesis... Penelitiannya seperti ini, kita menyimpulkan bahwa terbukti nyata sebenarnya ada kenaikan permintaan deterjen tiap minggu.

Jadi ini sekali lagi, kita jangan terlalu kaku di dalam menafsirkan output komputer di software. Jadi di software itu hanya defaultnya saja yaitu selalu uji hipotesis. Statistiknya adalah H0 sama dengan 0, H1 profisianya tidak sama dengan 0. Tapi dalam praktek bisa saja berbeda ya, misalkan saja dalam konteks ini bukan koefisien daripada waktu tadi sama dengan 0 atau tidak sama dengan 0, tapi sebenarnya ini mau menguji apakah ada kenaikan permintaan. Jadi kalau ada kenaikan permintaan, berarti hipotesis H1-nya adalah koefisiennya lebih besar dari 0. Kalau lebih besar dari 0, ternyata ini signifikan.

Jadi ini bisa saja dikembangkan untuk kasus lain. Misalnya, kita mau melihat apakah jika harga deterjen naik 1 dolar, maka permintaan akan turun minimal 4 unit. Misalnya, apakah jika harga deterjen naik 1 dolar, maka permintaannya akan turun lebih dari 4 unit. Jadi di dalam hal ini, koeficiennya, karena koeficiennya adalah kurang dari minus 4, berarti ini sebagai H1.

Jadi kalau... tidak mengandung sama dengan di A1. Berarti H0-nya lebih besar atau sama dengan.

Kemudian, kalau kita menggunakan stata ini, kita bisa dikeluarkan ini. Jadi, kalau misalkan saja sama dengan minus 4 dan tidak sama dengan, uji dui arahnya ini adalah sebenarnya 0,0273. Nah, kalau uji eka arahnya, dengan stata ini, sebenarnya nanti p-value-nya itu setengah daripada ini, sekitar setengahnya.

Berarti makin signifikan. Ini makin signifikan. Ini bisa ditunjukkan bahwa kalau misalkan saja eka arah itu titik kritisnya lebih kecil lagi sehingga cenderung lebih signifikan dibandingkan kalau dewi arah.

Contoh lain misalkan saja, apakah, jadi tadi kesimpulannya adalah jika harga naik 1 dolar, maka permintaan akan turun lebih dari 4 unit. Jadi hipotesis ini didukung oleh data. Jadi langsung kita simpulkan. Ini kalau kita lihat, untuk kasus lain, misalkan kalau ini adalah turun lebih dari 4 unit, kemudian misalkan masalah penelitiannya adalah jika harga deterjen naik 1 dolar, maka permintaannya akan turun minimal 4 unit.

Nah, kalau minimal 4 unit, berarti ini maksudnya koefisienya kurang atau sama dengan minus 4. Jadi bisa minus 4, minus 5, minus 6, gitu kan, dan sebagainya. Nah, karena ini adalah turun minimal itu mengandungi sama dengan, berarti dia sebagai H0. Lebih kecil atau sama dengan minus 4. Berarti H1-nya kebalikannya yaitu lebih besar. Jadi di sini sebenarnya yang diuji adalah yang sama dengannya.

Kemudian kita kalau menggunakan stata, ini bisa kita tunjukkan bahwa bahwa nilai p-value-nya untuk kasus ini nilai p-value-nya adalah 0,98. Artinya kalau 0,98 ini besar kita simpulkan dia apa? H0.

Berarti artinya pernyataan ini tidak ada alasan untuk menolak pernyataan ini. Jadi kesimpulannya adalah tidak ada alasan untuk menolak kesimpulan tadi. Jika harga deterjen naik 1 dolar maka permintanya akan turun minimal 4 unit.

Jadi kalau kita lihat di sini, ini adalah H1. Kalau H1 adalah di arah sini, ini adalah kecil. Maka kita simpulkan bahwa memang kurang daripada minus 4. Kemudian apakah beda dengan ini? Sebenarnya mirip.

Tapi di sini bukan hanya kurang dari minus 4, tapi bisa saja yang minus 4. Jadi minimal tadi, turun minimal 4. Jadi bisa 4, bisa 5, ini juga sama. Jadi sebenarnya ini kesimpulannya mirip. Tapi hati-hati ketika kita menurunkan.

atau mengembangkan hipotesis statistik ini. Jadi kalau dalam konteks ini, pernyataan tadi, hipotesis penelitiannya ini adalah diwujudkan dalam H1, direpresentikan dalam H1, karena tidak mengandung sama dengan. Sedangkan yang ini, karena mengandung sama dengan, ini direpresentikan oleh hipotesis statistik H0.

Jadi kita biasanya menyimpulkannya kalau H0, ini biasanya kita sebutkan tidak ada alasan untuk menolong kesimpulannya. Kenapa? Karena kalau kita langsung jika harga deterjen naik 1 dolar maka permintanya akan turun minimal 4 unit.

Pasti nanti akan ditanya berapa kesalahannya? Kalau kita menyimpulkan H0 kita tidak bisa mendapatkan berapa kesalahannya dari output computer. Sebenarnya ini bisa kita cari tapi ini terlalu panjang diceritakan di sini mungkin dalam sesi lain.

Jadi kalau di sini kita lihat ya Ini daerah H0 ini daerah sini gitu ya. Makanya ketika di daerah H0, karena H1-nya sebelah kanan, maka p-value-nya sangat besar. Sehingga kita simpulkan H0 ya. Jadi ini adalah kalau tidak menolak, artinya menerima kan, seperti ini.

Tapi biasanya di dalam menyimpulkan H0, kalimatnya seperti, bukan seperti ini ya. Kalau misalkan yang H1 langsung saja kalimatnya seperti ini, jadi jika harga jaterjian naik 1 dolar, maka permintaannya akan turun lebih dari 4 unit gitu ya. Kalau ditanya berapa kesalahannya?

Ya kesalahannya ini lebih dari ini. Jadi kalau kita menyimpulkan ini berarti kesalahannya adalah sekitar 1,3%. Oke.

Baik. Nah, di dalam statistika sebenarnya untuk menguji tadi gitu ya. Jadi sebelum menguji tadi kita harus melihat bagaimana asumsi daripada sisaan ya.

Tadi sudah disampaikan ya. Asumsi dari sisaan itu dia harus menyebar normal ya dengan nilai tengah. 0 dan ragamnya homogen. Kemudian antara error yang satu dengan error yang lain tidak berhubungan. Bebas.

Jadi bisanya untuk analisis sisaan secara deskriptif bisa menggunakan grafik untuk mengevaluasi pelanggaran asumsi. Jadi kita lihat bagaimana sisaan dengan X. Jadi kita gambarkan, jadi kalau ini X, disini sisaan. Kalau gambarnya seperti ini artinya 0. Berapapun nilai X ini ragamnya sama. Ragamnya sama.

Kemudian errornya juga nanti rata-ratanya ada sama dengan 0. Atau bisa saja, jadi kalau ini seperti ini gambarnya memenuhi asumsi dari Gauss-Marco. Artinya dia akan menghasilkan penduga metabias linear terbaik. Nah bisa juga sisaan ini dibagi dengan standar error sisaan.

Jadi untuk melihat standar dice residual. Jadi sisaan baku. Kenapa ini perlu dicari ini?

Karena untuk standardized residual kadang-kadang disebut geosubstantial. Sudentized residual, ini memungkinkan mempertimbangkan besaran sisaan, artinya kita ingin tahu juga kalau ada data yang besar sekali, ada yang data kecil sekali, ini sebenarnya data outlier atau tidak. Nah untuk menentukan apakah outlier atau tidak, kita bisa membandingkan dengan sisaan baku. Jadi misalkan saja kita lihat ya, untuk plot data nih.

Kalau misalkan saja plot sisaannya seperti ini, berarti ini kemungkinan modelnya, fungsinya tidak linear. Jadi kalau tidak linear, tadi sudah dibahas, ini adalah sumber error yang kedua, kemungkinan fungsi modelnya salah. Kita perbaiki. Kalau gini berarti linear.

Kemudian kalau homogen sama seperti ini, jadi yang sebelah kanan ini adalah yang memenuhi asumsi. Kalau heterogen, contohnya seperti ini. Jadi makin besar, X ragamnya makin besar.

Bisa juga kebalikannya seperti ini. seperti itu. Kemudian bisa juga gambarnya seperti ini. Kalau seperti ini, artinya X makin besar, ragamnya atau sisaan dari modelnya tadi, standardized residualnya ini makin lama makin tinggi. Berarti di sini tidak bebas.

Kalau yang ini kan bebas, berapapun nilai X, maka ragamnya sama saja. error tadi. Nah, kalau misalkan untuk data yang tadi kita gunakan, yaitu permintaan dengan beberapa variable tadi, yaitu harga, harga pesaing, biaya iklan, daya beli, kemudian juga kita ingin melihat tingkat awarenessnya, tiap minggu ada kenaikan atau tidak. Kalau kita lihat inilah plot sisaannya, residual dengan nilai dugaannya. Nah, di sini ada beberapa data yang mungkin relatif besar, tapi kita nggak tahu apakah outlier atau tidak.

Kalau kita menggunakan sisaan baku atau standardized residual, ini seperti skor jet saja, skor baku. Skor baku ini kalau ini normal dengan nilai tengah 0 dan ragam 1, kalau 95%, ini 2,5% sebelah kiri, 2,5% sebelah kanan, ini nilainya antara minus 1,96 sampai 1,96. Adanya... Oke lah, kita sederhanakan saja ini antara minus 2 sampai 2. Nah, kalau kita gambarkan di sini, ini adalah minus 2 sampai 2. Ini masih di atas minus 2. Nah, kalau kita lihat, ini ada yang di atas 2. Ini ada 2 titik, ini dengan di sini. Nah, ini kalau misalkan saja outlier ini kita buang, kemungkinan datanya hasilnya bisa lebih baik lagi.

Misalkan R kuadratnya lebih tinggi. Bahkan kemungkinan yang tadi tentang awareness tadi. T tadi, kemungkinan ini bisa langsung signifikan.

Nah inilah mengenai pendugaan dan pengujian model yang sangat mendasar yang harus kita benar-benar pahami. Nah, sebenarnya di dalam pengujian hipotesis tadi atau pengujian asumsinya di sini ada dua pendekatan. Seandainya kita menggunakan data deretor 2 atau time series data. Ada dua pendekatan.

Kalau regresi klasik, seperti yang tadi sudah kita bahas, biasanya tahapannya menduga model dulu, kemudian dilihat apakah asumsi error itu dipenuhi atau tidak. Nah, berbeda dengan menggunakan time series econometric modeling. Di sini biasanya tahapannya adalah bukan membuat model dulu, tapi kita lihat datanya sudah stasioner atau belum.

Kalau belum stasioner, harus distasionerkan dulu. Terus sampai mendapatkan stasiun. Kalau tidak stasiun, kita lakukan difference.

Ada semacam pembedaan pertama, dikurangi dengan data prioris sebelumnya. Nanti ini akan kita bahas di sesi berikutnya. Di lain sesi.

Ini ada dibahas di buku Ekonometrika Direktur 2 Times Series Ekonometrika. Namun yang ingin saya sampaikan sebenarnya bukan berarti pendekatan klasik ini salah. Asalkan ini memenuhi asumsi, sebenarnya ini adalah pemahaman tentang stasioner juga.

Artinya gini, kalau misalkan saja ini datanya seperti ini, berapapun nilai X, atau mungkin juga untuk waktu T tadi, itu sama saja ragamnya. Jadi kalau ragamnya ini konstan, kemudian nilai tengahnya ini konstan, tiap waktu, artinya dia stasioner. Artinya stasioner maupun...

asumsi dari gauss-marwak itu dipenuhi artinya kapanpun kita prediksi apakah 1, 2, 3 tahun ke depan itu bisa digunakan Inilah pentingnya kenapa asumsi daripada katakanlah homogen, ragamnya konstan, nilai tengahnya sama, tidak ada auto-korelasi, atau di dalam time series ini adalah harus stasioner, ini berarti implikasinya kalau sudah stasioner atau asumsi gauss-Marschhoff ini dipenuhi, maka model ini bisa digunakan kapan saja. Artinya hubungan antara X dengan Y ini dalam kondisi kesimbangan jangka panjang. Karena ragamnya tadi homogen tadi. Jadi misalkan ini seperti ini.

Tapi kalau yang sebelah kiri ya tentu saja nggak bisa kita pakai. Jadi kalau misalkan asumsi dipenuhi ini bisa untuk meramal ke depan. Baik, itu saja.

Yang berikutnya adalah, permasalahan berikutnya adalah bagaimana, kalau ini kan hanya deskripsi, bagaimana menguji asumsi daripada sisaan tadi. Apakah homogen atau heterogen. Bagaimana menguji apakah sisaan ini apakah bebas atau tidak bebas, atau ada autoporelasi.

Nah, nanti kita bahas dalam sesi berikutnya. Demikian ya, semoga bermanfaat. Sampai ketemu di topik yang lain. Terima kasih.

Assalamualaikum warahmatullahi wabarakatuh.