Enkätundersökning: Urval och metodik

Hej! I denna video så ska vi se på hur man kan laga en god spörreundersökelse. Det här är del 1 av 2. Så först kommer vi att se på vem vi ska undersöka, vad vi kan spöra om och hur vi kan göra ett utvalg på en god måte. I nästa video så ska vi se mer i detalj på hur man kan laga en god spörreundersökelse. För det första så... Då måste vi se på vem vi ska undersöka. Det är gärna människor som vi är intresserade av. Det kan kallas för enheter, utvalg och respondenter. Det finns många olika ord för det. Population och utvalg har vi snackat om i tidigare videor. Population är den samlingen av alla enheter som den problemstillingen vi har gäller för. Det kan vara alla studenter vid UiT, Det kan vara norska familjer på ferie i Nordsverige eller professionella idrottsutövare, ungdomar i ett viss aldersintervall eller allmänniska på hela jorden. Vi må ha en förmening om vad är population som vi önskar att träcka konklusioner om. Av och till så kan vi göra en undersökelse som omfattar hela population. I varje fall om den population vi ser på är ganska liten eller om vi har väldigt mycket. med medel och tid till rådighet. Men ofta måste vi göra ett utvalg. Det här bildet har vi också sett i tidigare videor. Vi har en stor population. Vi gör en datainsamling så vi får ett utvalg. På det utvalget, det datasättet, kan vi göra en dataanalys. Vi kan regna ut olika saker. Så kan vi träcka en konklusion om hela populationen. Om vi har gjort saker på en ordentlig måte och utvalget är representativt. Så det utvalget vi gör ska representera hela populationen. Vi ska se lite närmare på hur vi kan få det här att bli bra. Vi kallar de personerna i utvalget för respondenter. Vi kan snacka om observationer, enheter eller målingar. Det är lite avhängigt av vad vi driver på med. Ideellt sett så önskar vi att de variabler som vi... –undersöka i den här undersökelsen– –ska ha samma fördelning i utvalget som i population. Det kanske hörs lite rart ut, men för exempel kan det vara– –att aldersfördelningen i utvalget bör vara likt som i population. Så om vi önskar att träcka en konklusion om hela Norges befolkning– –så kan vi inte bara spåra folk som är år. Det kan vara andel kvinnor och män som är viktiga att vi följer med på. Eller andra ting som är viktiga för den undersökelse som vi gör. Så vi inte får en sån skäffördelning på svaren. Hur stort utvalg tränger man ha? Är det så att om man har en stor population så må man ha ett väldigt stort utvalg? Om vi för exempel ska se på vad tror vi att folk blir att stämma i valget i USA? Är det så att vi måste börja... enormt många personer där, för det är ett så stort land, i sammanlignning med Norge, som har mycket färre invånare. Nej, det är inte helt så. Det är den absoluta störrelsen på utvalget som är viktig. Man brukar se att minst 100 per undergruppe måste man ha, alltså minst 100 personer per undergruppe. Då måste man se vad en undergrupp är. Det kan ha att göra med med fördelningar i population, på alder, geografi, bakgrund, utdanning osv. Det får man laga sig en liten förmening om för att samla in sitt utvalg. Minst 30 står det i boken. Det är klart att det är ganska lite, men av och till avhänga av vårt stort projekt och vad vi ska finna ut av så kanske det kan vara nog med 30. Det är nog faktorer som spiller in. Krav på nöjaktighet, hur nöje må vi vara? Är det ett sådant estimat, ett anslag? Eller ska vi göra en ganska precis värdering av en situation? Budget spiller gärna in. Vi har inte tid eller pengar till att göra en väldigt stor undersökelse. Det kostar pengar, så många gånger må vi begränsa oss på grund av det. Vi måste också se på varians för viktiga variabler i population. Om vi vet något om det här, att här har vi variabler där det vill vara stora forskjeller, så är det viktigt att vi har ett större utvalg för att det inte ska vara så mycket tillfälliga variationer innanför det utvalget vi har. Så om vi vet något om det här så kan det vara med på att hjälpa oss att designa en undersökelse som blir god nok. Generellt sett är det ju slik att ett större utvalg vill ge oss en bedre. Vi ska se på något som kallas för sannsynlighetsutvalg. Det är en måte att göra ett utvalg ifrån en population som vill ge oss en stor sannsynlighet för att utvalget vi har blir representativt för populationen. Så att vi kan generalisera och bruka statistisk teori för att träcka konklusioner om hela populationen. Den första och mest vanliga måten att göra det här på är... enkel tillfällig träckning. Här ser vi ett bild som illustrerar det här. Här har vi rätt och slett tryckeenheter tillfällig från population, omtrent som en loddträckning. Så alla personer eller enheter har samma sannsynlighet för att bli trycket. Det här är en väldigt god måte att göra det på för att få en spredning i population och få en god möjlighet att generalisera efterpå. Vi kan... och gör något som vi kallar för stratificerad utväljelse. Om vi vet att vi har viktiga kategorier, för exempel kön, alder, geografi och så vidare, där vi önskar att få en bra fördelning, då kan vi fördela upp populationen. Och så träcker vi, från vart sådant strata som vi kallar det, ett bestämt antal enheter med enkel tillfällig träckning från den gruppen. Det vill garantera att alla viktiga undergrupper blir representerat i utvalget. Vi kan göra på försäljningsmått där vi kan enten göra så att vi träcker så många så att den fördelningen blir lik som i population. Så att om det är 50% kvinnor och 50% män så önskar vi ha det i utvalget. Men det kan nog vara så att vi har små undergrupper i ett datasätt eller i en population som vi önskar få representerat i datasättet. Så att vi kanske tar lite fler från den gruppen så att vi får ett stort utvalg från den gruppen. Vi önskar kanske att komma upp i 30 eller 100 från den undergruppen för att få en bättre statistisk sannsynlighet. Då vill vi få en annan fördelning i de här stratificerade utvalgen än i population. Men det kan vi justera för till slut så kan vi regna tillbaka med väckting. Så att stratificerat utväljelse. Det ger oss mindre usäkerhet, det ger oss en större precision och det reducerar variansen till variablerna. Vi ska se på ett litet exempel som vi faktiskt har sett på i statistiken här. När vi såg på estimat så hade vi följande exempel. Det var en bonde som drev med kylling och drätt och skulle pröva att estimera värdigen av förväntet slakt i väkt. Då var det två möjligheter här. Den ena var att det var tagit genomsnitt av 4 kyllinger och 8 kyllinger. Och så tog man bara och tog genomsnitt av det. Eller så har vi möjligheten att vi tog 8 gånger x-genomsnittet plus 4 gånger y-genomsnittet delt på 12. Jag vet inte om ni huskar den här uppgaven men ni kan gå tillbaka till estimatvideon och se. Så det vi såg här var att bägge de här... estimatorerna var förväntningsrättet. Men nummer två här som ser lite mer avancerat ut, den har minst varians. Det här kan faktiskt se att det här tillsvarar för exempel ett enkelt tillfälligt utvalg. Den här andra är faktiskt ett stratificerat utvalg där vi har bestämt att vi ska ha en viss andel från en viss grupp och en viss andel från en annan grupp. Och så regnar vi ut det här till slut. Så det här är ett exempel på varför ett stratificerat utvalg kan ge oss en mindre varians och en större säkerhet. Om vi nu gör det på den måten att vi ser till att fördelningen i det stratificerade utvalget är lik fördelningen i population på viktiga variabler. Vi kan då göra något som heter klingeutväljelse. Och då grupperar vi enheterna i klingor eller kluster. Och så väljer vi ut ett visst antal klingor eller enheter och har utvalgat att alla de enheter som är i den klingen blir med. Det här kan brukas av praktiska och ekonomiska grunder, att det blir enklare att genomföra en undersökelse på den måten. För exempel kunde vi ha tänkt oss att vi önskar undersöka ansatte vid alla universitet i hela Norge. Men det vill vara ganska dyrt och krävandes att göra en så stor undersökelse som går ut till var och en i hela Norge som är ansatt på ett universitet. Då kan man dela in de här universiteten och se att vart universitet i Norge det är en klinge. Och så väljer vi ut tre tillfälliga universitet. Och så sänder vi ut den här spörrundersökelsen till alla ansatte på de tre universiteten. Så det blir vårt utvalg. Klingutväljelse eller cluster kan vi se i det här bildet. Man grupperar upp och så väljer man ut några grupper. Det här ger en större usäkerhet och mindre precision. Men det har att göra med att det är praktiskt, det är lättare att distribuera en undersökelse, lättare att genomföra och det kan fortsatt ge oss goda resultat. Vi kan också göra... Det betyder att enkeltelementet sannsynlighet för att värme i utvalget är okänt för oss. Vi kan inte regna oss tillbaka till den saken. Det gör att det är umöjligt för oss att se något om graden av representativitet. Det blir vansklig att generalisera. Ofta är det billigare och enklare att få till än ett ordentligt sannsynlighetsutvalg. Det är därför vi väljer att göra det här. Problemet är att vi inte kan generalisera till hela populationen. Så vi ska se på något sådant. Den som vi nämnt tidigare i kvalitativ metod är bekvämlighetsutvalg. Det betyder att vi väljer respondenter som är lätt tillgängliga. Någon som står oss när, någon som är i klassen eller i familjen. Eller att vi ställer oss på köpcentret en lördag förmiddag och så plockar vi folk som går förbi oss. Det här blir ju inte representativt för hela population om det inte var så att vi gör en undersökelse i klassenvarens eller i familjen så att det är folk som stås när. Men det är enkelt att få till och det kan benyttes till pretesting. Om vi ska utarbeta en undersökelse så kanske vi önskar att testa ett spörreschema på ett antal personer och då kan det vara nyttigt. Men man ska vara försiktig med bekvämlighetsutvalg för om man lägger ner för mycket tid och resurser på det så får man kanske ett resultat som inte kan brukas till det som det var tänkt. Ett kvoteutvalg finns det, något som heter, och det är egentligen en form för bekvämlighetsutvalg. Men vi är lite mer avancert. Vi prövar att få samma fördelning på viktiga variabler som i population. För exempel kanske vi önskar att intervjua fem kvinnor och fem män för då får vi i varje fall en likfördelning på kvinnor och män. Ett värderingsutvalg är att vi väljer respondenter som vi vet är hänsiktsmässiga att ha med. För exempel en expert eller folk som vi vet har en relevant erfaring. Det här brukar se mycket till intervjuer och kvalitativa undersökelser men det kan också vara aktuellt i kvantitativa. Om vi önskar få svar från folk som faktiskt har upplevt något speciellt så må vi se till att de som vi delar ut den här spörrundersökelsen till faktiskt har den relevanta kunskapen. Säljutväljelse. Det är ju att respondenter får melda sig på och säga att jag önskar vara med i den här. Eller att vi lägger ut på en Facebooksida och kanske säger att den som är intresserad kan få svara på det här. Snöballmetoden har vi också snackat om i kvalitativ metod. Det betyder att vi rekryterar noga informanter och de i sin tur kan ge oss information av flera goda informanter. Det är en mer vanlig kvalitativ metod också, så det är inte så väldigt relevant för oss. Men det här är i alla fall ett antal måter att samla in sitt utvalg på, som är bättre eller dåligare. Dessvärre så må vi begränsa oss av budget och tid. Men vi kan ju pröva att göra det så bra som möjligt i vart fall. När vi har gjort ett utvalg. Så, må vi se över hur många som faktiskt svarar på det här. Så utvalgade är alla de som vi sänder ut spörre-schemat till eller alla som vi tar kontakt med. Men svar-respons är de som faktiskt har svart. Det är en frivillighet här så vi vill helt säkert få folk som tackar nej till att delta i en studie. Vi snackar om ett par olika begrepp här. Bruttoutvalgade är alla respondenter som vi har valt ut till att delta. för exempel med en tillfällig träckning. Nettoutvalget är de som faktiskt till syvende och sist deltar och svarar på våra spörsmål. Så vi kan regna ut svar-respons eller svar-procent genom att ta nettoutvalget och dela på bruttoutvalget. Och så tar vi gånger 100% så får vi det i procent. I boken så står följande tal så att 80-90% är en svärt höjt svar-procent. Får man en sån svarprocent så ska man vara väldigt förnöjd. Man brukar säga att cirka över 50% är acceptabel men alldeles idag så får vi problem med generalisering. Att få en svarprocent på 30-40% är vanlig men det ger oss ju problem när vi ska snacka om statistisk säkerhet och generalisering. Det är inte vanligt att få ändå lavere svarprocent med. Och så kan vi tänka på det när vi har vårt utvalg. Om vi sänder ut en spörundersökning till svårt många människor så är det en stor risk för att vi ändrar upp med en lav svarprocent. Det gör att det som vi kanske tänkte oss var ett tillfälligt utvalg, egentligen blev ett sånt där folk meldde sig på om de är intresserade. Så vi får inte helt styring över utvalget om vi gör det på den måten. Så här må man vara försiktig. Vi kan då tänka igenom vilka strategier vi kan ha för att få störst möjlig svarprocent. Om vi ska sända nummer ut så bör vi göra det i en period när vi tror att folk är tillgängliga och har tid till att svara. Om vi ringer runt i folk så må vi göra det på ett gott tidspunkt. Så vi kan pröva att få en större svarprocent genom att vara lur. Men vi må tänka på att det är många som inte har lyst att svara. Det är många som har... En liten sån overload av spörundersökelser som man får sända till sig varje gång man har varit i en butik omtrent. Så det är inte säkert att folk har lyst att svara. Det är också så att folk som är intresserade vill ju i större grad svara på något. Och då kan ju det leda till att vi inte helt får ett sånt tillfälligt utvalg som vi önskar oss. Så det är många problem här. Och det här är sånt som man må värdera och man må gärna skriva om det i en rapport. Om det är sånt man har. ett projekt där det här ska presenteras i eftertid. Om vi känner till hur viktiga variabler fördelas i en population då kan vi göra en bortfallsanalyse när vi har samlat in våra data. Här har vi ett exempel som är ifrån en rapport där det är gjort en undersökelse bland ganska många allmänläger. Här ser vi i en kolonne att det är spurt Det här är utevalget. Och så ser vi här att vi har den virkliga fördelningen bland alla läger. Och här kan man ju sammanligna. Hur många är det här? Vad är det för andel? Vi ser att många av de här variablerna så är fördelningen i utevalget, den som är orange, den orange kolonnen här, är likt det som vi ser i population som är den gröna. Så här kan vi ju själv värdera när vi läser den här artikeln. Om det här har varit ett bra utvalg och om det är någon av de här som är där fördelningen är annerledes. Det är större risiko att vi får utvalgsfejl om vi har små utvalg. Så om vi har många respondenter så vill den här risikoen bli mindre. Väckting. Om det är så att avvikning mellan utvalg och population är stort så kan vi väckta resultatet. Men då må vi känna till. fördelningen av den aktuella variabeln i population. Det kan ofta vara sådana som kön, alder och geografi där vi vet hur fördelningen är. Här har vi ett exempel som kommer från boken där vi har gjort en undersökelse och spurt folk om hur de har stämt i ett valg. Vi vet att fördelningen av kvinnor och män i population är cirka 50% på var. Men i det här utvalget så ser vi att det är 40% i utvalget som är kvinnor och 60% som är män. Då kan vi regna ut en väckningsfaktor här genom att ta andel i population delt på andel i utvalget. Ofta kanske man ville ha skrivit 0,5 delt på 0,4 istället. Men det här blir riktigt. Vi får en väkt här så att resultaten från kvinnor ska väktas höjare än från män. För det är för få kvinnor i det här utvalget. Så här kan det se ut när vi driver på med väckning. Vi vet att... väkt för kvinnor här, det blir 1,25. Och så har vi tält upp att det var 8 i utvalget som stämte på höjre, för exempel. Då kan vi justera det här genom att multiplicera med den här väktfaktorn. Och se att om det hade varit en fördelning som hade varit riktig här, att det hade varit lika många kvinnor som män, så ville det varit 10 kvinnor som svart att de stämte höjre. Och det ville ha varit 15 män. Så att... Antalet kvinnor justeras lite upp och antalet män justeras lite ned. Så vi kan göra det så här med det om vi känner till hur variabeln är fördelt. Vi har sett på hur man kan definiera population till en undersökelse och göra ett utvalg på en god måte. Så nu ska vi gå vidare och se på variabler som vi ska undersöka. Alltså vad är det vi egentligen ska samla in data om? Till att börja med är det så att en god spörreundersökning må vara gott förankrad i den problemstilling vi har i vår projekt eller undersökning. En problemstilling eller ett forskningsspörsmål definierar vi som ett spörsmål som blir ställt med ett bestämt förmål på en så precis måte att det lär belysa genom bruk av samfundsvetenskapliga metoder. Detta är ju detsamma som när vi har kvalitativ metod. En problemstilling eller ett forskningsspörsmål kan gärna vara formulert som ett eller fler spörsmål som vi önskar att finna svar på. Men det kan också vara ett tema vi önskar att finna ut om eller en hypotes som vi önskar att testa. Så en god problemstilling är avgränsat, precis, tydlig och spissete. Och vi kan gärna formulera den som spörsmål. Etterpröbarheten blir ju mycket lättare att checka. om vi har ett spörsmål. Då kan vi se efterpå, har vi fått svar på det vi egentligen lurte på? När vi lagar en spörrundersökelse så är det många ting vi kan spöra om. Men det vi spör om, vill det ge oss svar på det vi egentligen är ute efter? Begrepper har vi också haft dem i kvalitativ metod. När vi ska börja laga en spörrundersökelse så måste vi först tänka igenom om det är några viktiga nökelbegrepper som vi har som är knyttet till temat. problemstillingen. Ett exempel som jag ska ta här är om vi önskar att göra en undersökelse av studenters matvanor. Det är ju många ting vi kunde spara om. Och där har vi försäljning begrepp här som kan vara viktig att se på. Matvanor, det är ett sådant ord som vi brukar med, men vad betyder det egentligen? Om man ska bryta det lite ner och kunna ställa ett konkret spörsmål om det. När vi snackar om att mat är billig eller dyr så må vi kanske avgränsa det lite mer konkret. Det kan vara andra ting som näringsinnehåll och hälsotillstånd. Vår matvanor påverkar skolprestation. Vi har många begrepp som vi tänker att vi sköner vad det här betyder. Men om vi ska ställa spörsmål om det här så är det otroligt viktigt att vi försikrar oss om att den som svarar på spörsmålet sköner vad vi har ment. Så att man inte har en försäljlig förståelse för några av de här begreppen. Så det är att sätta sig ner och skriva upp vilka begrepp som är viktiga och pröva att formulera goda spörsmål. Kanske må vi in och förklara ett begrepp i en spörundersökelse. Först förklara att med det här begreppet menar vi sådant och sådant och så ställer vi ett spörsmål. Det kan vara så att vi må dekomponera begreppet. Dela det upp och definiera hur vi har tänkt måla det här. För exempel kan vi se att ordet ungdom kanske vi ska dela upp i försäljning av aldersintervall. Vad menar vi egentligen med det här? Och när vi snackar om att mat är billig så kan det ju vara så att vi önskar att sätta ett tal på pris på något. Eller kanske pröva att se i förhållande till inkomst. Om du brukar 50% av inkomsten på mat eller 40%. Så det här kan vi tänka lite runt och kanske vara lite kreativ för att se Hur kan vi dekomponera begreppen så att vi kan ställa förnuftiga spörsmål om det här? Operationalisering är också något som vi snackat om i kvalitativ metod. Det betyder att göra målbart. Och för att ha stora norska lexikon så har vi följande definition. Det handlar om att formulera klara kriterier för hur enheter, begrepp eller sammanhänge ska representeras vid empiriska data. Operationalisering av en variabel innebär vanligvis att klargöra hur målingen av variabeln ska genomföras. Och det kan ju vara lite av det vi såg med begrepp, att vi dekomponerar begrepp och finner fram till att detta är det. Detta ska vi spara om. Vi kanske ska ha fler spörsmål som går på hälsotillstånd och pröva att måla det här. Men det kan nog vara så att någon gång så är det fenomen som vi önskar undersöka. Där det inte är säkert att vi kan ställa någon direkt spörsmål om det här. Och då kan det vara att vi måste bruka indikatorer. En indikator den säger indirekt något om det vi vill ha svar på. Eller vi tror att en... kan säga något om det vi önskar svar på. Det här är några indikatorer och det är avhängigt av vad vi undersöker. Men inkomst är en sak som vi kan spara om. Vi vet att det kan påverka ganska mycket i livet. Samma med civilstånd, om man har barn eller inte. Det är saker som kan vara intressant att spara om. Även om det inte är direkt i det vi undersöker så tänker vi att det kan påverka andra saker. Inkomsten påverkar vad vi har möjlighet att göra. Det kan påverka hälsan vår, hur mycket pengar vi brukar på mat eller allt möjligt. Vi kan måla hur ofta man gör något. Vi kanske önskar att finna ut hur viktigt något är för en viss grupp människor. Då kan vi fråga om sådana saker. Hur ofta gör du detta? Eller hur mycket pengar brukar du på detta? indikatorer på om man syns något är viktigt, om det är något som blir värdesatt och som har stort fokus. Till slut när vi har gjort den här jobben med operationalisering, vi har sett på på förskälliga begrepp, vi har prövd att formulera några spörsmål eller funderat ut hur vi ska måla saker. Det är inte säkert att vi måste spara om saker, vi kan finna ut information på förskälliga måter kanske. på Statistiskt centralbyrå eller observation eller något annat. Men det vi ändå upp med till slut är variabler. Det är alltså de egenskaper som undersökes eller svar på de spörsmål som vi ställer till respondenten. Det är sådant som kan anta två eller flera värdier. Så det här är något som vi kan måla, sätta ett tal på eller sätta i olika kategorier. Här har vi ett antal exempel på variabler som vi ofta spör om i spörrundersökningar. Vi ser att det här är olika typer av variabler. Några av dem är inkomster eller alder. Det kan vi lätt sätta ett tal på. Vi tjänar så många pengar eller är så många år gammal. Könn är kategorier. Skostörelse kan vi ange i skostörelser och nummer. En karaktär på en pröve kan ju vara det, för exempel från A till F. Så det är försäljtyper av variabler. Och vi snackar om försäljtyper av målnivå. Så det laveste nivået är det vi kallar för kategoriska variabler eller nominala variabler. Det är för exempel kön, utdanning och andra sådana spörsmål. Det här är de kategorier som är gensidigt uteluckande. Alltså man kan bara hucka av för... en av kategorierna. Sådana variabler kan vi kategorisera. Vi kan bara säga att det var så många som valde det alternativet och så många som valde det andra. Vi kan ha flera möjliga kategorier här. Ordinalnivå är nästa. Där kan vi arrangera de här försäljade svaren. Men det är inte precis avstånd mellan variablerna. För exempel kan vi spara om man är svärt oenig, lite oenig eller till svärt enig. Vi kan av och till se att vi önskar ge ett svar på en skala från 1 till 5. Så vi kan sätta ett tal på det, men det är ju inte så att vi kan se att jag var dobbelt så enig som någon annan. Eller att vi kan se att avstånden mellan svärt oenig och lite oenig är lika stor som avstånden mellan neutral och lite enig. Det är ju inte säkert att vi har fem nivåer, det kan vara sju eller tio eller något annat. Intervall och förhållstal är när vi sätter tal på ting. Det är sådana variabler som alder, antal timers sömn per natt, lön, allt möjligt. Här kan vi arrangera och se att det där var ett lavere värde i den en höjare men avstånd mellan variablerna vill ågi mening. Vi kan se att någon har dobbelt så höj lön som någon andra. När det är intervall så har vi inte något naturligt 0-punkt. För exempel gäller det för skostörelse och kanske temperatur i grader Celsius där vi har en skala som vi går efter. Vi kan av och till samla in förhållstal, för exempel på alder och så kan vi laga aldersintervall. efterpå. Så intervall och förhållstal går lite in i varandra och det är ofta inte så viktigt att vi sköner så stor förskäl på dem. Avhängigt av vilket målnivå vi har på det vi nu samlar in av data så är det försäljning som vi kan regna ut. Om vi ser på centralmål för nominale variabler så kan vi se på den vanligaste värdigen. Vi kan inte regna ut någon genomsnitt här. Vi kan bara se att det var fler män än kvinnor som svarta här. För ordinal nivå så kan vi se på median, alltså den mittersta värdigen. Vi kan också se på typetal, alltså den vanligsta värdigen. Men för intervall och förhållstal kan vi regna ut genomsnitt, vi kan regna ut median. Vi kan också se på typetal, så med förhållstal har vi alla möjligheter till beräkningar på alla möjliga måter. När det gäller statistiska analyser, så blir vi obegränsade om vi har ett lavere målenivå. Så för nominale variabler så kan vi laga kryss-tabeller och vi kan genomföra en kikvadrat-test som det finns en annan video på. Vi kan i någon tillfälle bruka nominale variabler som dummy-variabler i regression. Så det kan man göra. För ordinal nivå så kan vi laga kryss-tabeller och kikvadrat-test. Vi kan bruka... ordinal nivå i regression. Det är egentligen inte helt riktigt men det är fullt möjligt. Eller som en dummyvariabel. Men för intervall och förhållstal så kan vi göra konfidensintervall, vi kan genomföra alla möjliga försäljningstest, Z-test, T-test. Vi kan sammanligna grupper med paret och utparet T-test. Vi kan genomföra en regression, vi kan genomföra egentligen alla möjliga ting. Så att för vår del när vi tänker Ett skritt vidare, vi ska genomföra en dataanalys här efterpå. Så vill det vara positivt för oss att få höjst möjlig målnivå. Eftersom det vill ge oss mer information, mer detaljert information. Och ge oss fler möjligheter till statistiska analyser. Vi ser ju det att kan vi genomföra en t-test istället för en t-kvadrattest. Så kan vi se något mycket mer precis om våra hypoteser. Så det är positivt för oss, men det är ju inte allt som vi kan måla på den måten. Så vi måste ju åtenka oss om vad är förnuftigt? På vilken måt är det förnuftigt att måla den här variabeln? Och vad kan vi egentligen finna ut av? Det är en risiko om vi samlar in för detaljerade data med att vi tror att vi vet något väldigt exakt. Om vi för exempel lagar en ordinalskala med många försäljningsnivåer så verkar det kanske som att vi har fått väldigt detaljert information. Men hur är det för den som ska svara på det här? Ge det mening att ha... tio nivåer eller blir det bara en ren jättning från den personen? Kanske det hade varit mer förnuftigt att ha tre nivåer, för det är mycket lättare att svara på. Så man ska försöka få ett högt målenivå, men inte överdrivet.

För det första så... Då måste vi se på vem vi ska undersöka. Det är gärna människor som vi är intresserade av. Det kan kallas för enheter, utvalg och respondenter. Det finns många olika ord för det. Population och utvalg har vi snackat om i tidigare videor.

Population är den samlingen av alla enheter som den problemstillingen vi har gäller för. Det kan vara alla studenter vid UiT, Det kan vara norska familjer på ferie i Nordsverige eller professionella idrottsutövare, ungdomar i ett viss aldersintervall eller allmänniska på hela jorden. Vi må ha en förmening om vad är population som vi önskar att träcka konklusioner om.

Av och till så kan vi göra en undersökelse som omfattar hela population. I varje fall om den population vi ser på är ganska liten eller om vi har väldigt mycket. med medel och tid till rådighet. Men ofta måste vi göra ett utvalg.

Det här bildet har vi också sett i tidigare videor. Vi har en stor population. Vi gör en datainsamling så vi får ett utvalg. På det utvalget, det datasättet, kan vi göra en dataanalys.

Vi kan regna ut olika saker. Så kan vi träcka en konklusion om hela populationen. Om vi har gjort saker på en ordentlig måte och utvalget är representativt.

Så det utvalget vi gör ska representera hela populationen. Vi ska se lite närmare på hur vi kan få det här att bli bra. Vi kallar de personerna i utvalget för respondenter.

Vi kan snacka om observationer, enheter eller målingar. Det är lite avhängigt av vad vi driver på med. Ideellt sett så önskar vi att de variabler som vi...

–undersöka i den här undersökelsen– –ska ha samma fördelning i utvalget som i population. Det kanske hörs lite rart ut, men för exempel kan det vara– –att aldersfördelningen i utvalget bör vara likt som i population. Så om vi önskar att träcka en konklusion om hela Norges befolkning– –så kan vi inte bara spåra folk som är år.

Det kan vara andel kvinnor och män som är viktiga att vi följer med på. Eller andra ting som är viktiga för den undersökelse som vi gör. Så vi inte får en sån skäffördelning på svaren.

Hur stort utvalg tränger man ha? Är det så att om man har en stor population så må man ha ett väldigt stort utvalg? Om vi för exempel ska se på vad tror vi att folk blir att stämma i valget i USA?

Är det så att vi måste börja... enormt många personer där, för det är ett så stort land, i sammanlignning med Norge, som har mycket färre invånare. Nej, det är inte helt så. Det är den absoluta störrelsen på utvalget som är viktig.

Man brukar se att minst 100 per undergruppe måste man ha, alltså minst 100 personer per undergruppe. Då måste man se vad en undergrupp är. Det kan ha att göra med med fördelningar i population, på alder, geografi, bakgrund, utdanning osv.

Det får man laga sig en liten förmening om för att samla in sitt utvalg. Minst 30 står det i boken. Det är klart att det är ganska lite, men av och till avhänga av vårt stort projekt och vad vi ska finna ut av så kanske det kan vara nog med 30. Det är nog faktorer som spiller in. Krav på nöjaktighet, hur nöje må vi vara?

Är det ett sådant estimat, ett anslag? Eller ska vi göra en ganska precis värdering av en situation? Budget spiller gärna in.

Vi har inte tid eller pengar till att göra en väldigt stor undersökelse. Det kostar pengar, så många gånger må vi begränsa oss på grund av det. Vi måste också se på varians för viktiga variabler i population. Om vi vet något om det här, att här har vi variabler där det vill vara stora forskjeller, så är det viktigt att vi har ett större utvalg för att det inte ska vara så mycket tillfälliga variationer innanför det utvalget vi har.

Så om vi vet något om det här så kan det vara med på att hjälpa oss att designa en undersökelse som blir god nok. Generellt sett är det ju slik att ett större utvalg vill ge oss en bedre. Vi ska se på något som kallas för sannsynlighetsutvalg. Det är en måte att göra ett utvalg ifrån en population som vill ge oss en stor sannsynlighet för att utvalget vi har blir representativt för populationen. Så att vi kan generalisera och bruka statistisk teori för att träcka konklusioner om hela populationen.

Den första och mest vanliga måten att göra det här på är... enkel tillfällig träckning. Här ser vi ett bild som illustrerar det här. Här har vi rätt och slett tryckeenheter tillfällig från population, omtrent som en loddträckning.

Så alla personer eller enheter har samma sannsynlighet för att bli trycket. Det här är en väldigt god måte att göra det på för att få en spredning i population och få en god möjlighet att generalisera efterpå. Vi kan... och gör något som vi kallar för stratificerad utväljelse. Om vi vet att vi har viktiga kategorier, för exempel kön, alder, geografi och så vidare, där vi önskar att få en bra fördelning, då kan vi fördela upp populationen.

Och så träcker vi, från vart sådant strata som vi kallar det, ett bestämt antal enheter med enkel tillfällig träckning från den gruppen. Det vill garantera att alla viktiga undergrupper blir representerat i utvalget. Vi kan göra på försäljningsmått där vi kan enten göra så att vi träcker så många så att den fördelningen blir lik som i population. Så att om det är 50% kvinnor och 50% män så önskar vi ha det i utvalget.

Men det kan nog vara så att vi har små undergrupper i ett datasätt eller i en population som vi önskar få representerat i datasättet. Så att vi kanske tar lite fler från den gruppen så att vi får ett stort utvalg från den gruppen. Vi önskar kanske att komma upp i 30 eller 100 från den undergruppen för att få en bättre statistisk sannsynlighet. Då vill vi få en annan fördelning i de här stratificerade utvalgen än i population. Men det kan vi justera för till slut så kan vi regna tillbaka med väckting.

Så att stratificerat utväljelse. Det ger oss mindre usäkerhet, det ger oss en större precision och det reducerar variansen till variablerna. Vi ska se på ett litet exempel som vi faktiskt har sett på i statistiken här. När vi såg på estimat så hade vi följande exempel.

Det var en bonde som drev med kylling och drätt och skulle pröva att estimera värdigen av förväntet slakt i väkt. Då var det två möjligheter här. Den ena var att det var tagit genomsnitt av 4 kyllinger och 8 kyllinger.

Och så tog man bara och tog genomsnitt av det. Eller så har vi möjligheten att vi tog 8 gånger x-genomsnittet plus 4 gånger y-genomsnittet delt på 12. Jag vet inte om ni huskar den här uppgaven men ni kan gå tillbaka till estimatvideon och se. Så det vi såg här var att bägge de här... estimatorerna var förväntningsrättet. Men nummer två här som ser lite mer avancerat ut, den har minst varians. Det här kan faktiskt se att det här tillsvarar för exempel ett enkelt tillfälligt utvalg.

Den här andra är faktiskt ett stratificerat utvalg där vi har bestämt att vi ska ha en viss andel från en viss grupp och en viss andel från en annan grupp. Och så regnar vi ut det här till slut. Så det här är ett exempel på varför ett stratificerat utvalg kan ge oss en mindre varians och en större säkerhet. Om vi nu gör det på den måten att vi ser till att fördelningen i det stratificerade utvalget är lik fördelningen i population på viktiga variabler.

Vi kan då göra något som heter klingeutväljelse. Och då grupperar vi enheterna i klingor eller kluster. Och så väljer vi ut ett visst antal klingor eller enheter och har utvalgat att alla de enheter som är i den klingen blir med.

Det här kan brukas av praktiska och ekonomiska grunder, att det blir enklare att genomföra en undersökelse på den måten. För exempel kunde vi ha tänkt oss att vi önskar undersöka ansatte vid alla universitet i hela Norge. Men det vill vara ganska dyrt och krävandes att göra en så stor undersökelse som går ut till var och en i hela Norge som är ansatt på ett universitet.

Då kan man dela in de här universiteten och se att vart universitet i Norge det är en klinge. Och så väljer vi ut tre tillfälliga universitet. Och så sänder vi ut den här spörrundersökelsen till alla ansatte på de tre universiteten.

Så det blir vårt utvalg. Klingutväljelse eller cluster kan vi se i det här bildet. Man grupperar upp och så väljer man ut några grupper.

Det här ger en större usäkerhet och mindre precision. Men det har att göra med att det är praktiskt, det är lättare att distribuera en undersökelse, lättare att genomföra och det kan fortsatt ge oss goda resultat. Vi kan också göra... Det betyder att enkeltelementet sannsynlighet för att värme i utvalget är okänt för oss. Vi kan inte regna oss tillbaka till den saken.

Det gör att det är umöjligt för oss att se något om graden av representativitet. Det blir vansklig att generalisera. Ofta är det billigare och enklare att få till än ett ordentligt sannsynlighetsutvalg.

Det är därför vi väljer att göra det här. Problemet är att vi inte kan generalisera till hela populationen. Så vi ska se på något sådant. Den som vi nämnt tidigare i kvalitativ metod är bekvämlighetsutvalg. Det betyder att vi väljer respondenter som är lätt tillgängliga.

Någon som står oss när, någon som är i klassen eller i familjen. Eller att vi ställer oss på köpcentret en lördag förmiddag och så plockar vi folk som går förbi oss. Det här blir ju inte representativt för hela population om det inte var så att vi gör en undersökelse i klassenvarens eller i familjen så att det är folk som stås när.

Men det är enkelt att få till och det kan benyttes till pretesting. Om vi ska utarbeta en undersökelse så kanske vi önskar att testa ett spörreschema på ett antal personer och då kan det vara nyttigt. Men man ska vara försiktig med bekvämlighetsutvalg för om man lägger ner för mycket tid och resurser på det så får man kanske ett resultat som inte kan brukas till det som det var tänkt. Ett kvoteutvalg finns det, något som heter, och det är egentligen en form för bekvämlighetsutvalg.

Men vi är lite mer avancert. Vi prövar att få samma fördelning på viktiga variabler som i population. För exempel kanske vi önskar att intervjua fem kvinnor och fem män för då får vi i varje fall en likfördelning på kvinnor och män. Ett värderingsutvalg är att vi väljer respondenter som vi vet är hänsiktsmässiga att ha med. För exempel en expert eller folk som vi vet har en relevant erfaring.

Det här brukar se mycket till intervjuer och kvalitativa undersökelser men det kan också vara aktuellt i kvantitativa. Om vi önskar få svar från folk som faktiskt har upplevt något speciellt så må vi se till att de som vi delar ut den här spörrundersökelsen till faktiskt har den relevanta kunskapen. Säljutväljelse. Det är ju att respondenter får melda sig på och säga att jag önskar vara med i den här.

Eller att vi lägger ut på en Facebooksida och kanske säger att den som är intresserad kan få svara på det här. Snöballmetoden har vi också snackat om i kvalitativ metod. Det betyder att vi rekryterar noga informanter och de i sin tur kan ge oss information av flera goda informanter.

Det är en mer vanlig kvalitativ metod också, så det är inte så väldigt relevant för oss. Men det här är i alla fall ett antal måter att samla in sitt utvalg på, som är bättre eller dåligare. Dessvärre så må vi begränsa oss av budget och tid.

Men vi kan ju pröva att göra det så bra som möjligt i vart fall. När vi har gjort ett utvalg. Så, må vi se över hur många som faktiskt svarar på det här. Så utvalgade är alla de som vi sänder ut spörre-schemat till eller alla som vi tar kontakt med. Men svar-respons är de som faktiskt har svart.

Det är en frivillighet här så vi vill helt säkert få folk som tackar nej till att delta i en studie. Vi snackar om ett par olika begrepp här. Bruttoutvalgade är alla respondenter som vi har valt ut till att delta.

för exempel med en tillfällig träckning. Nettoutvalget är de som faktiskt till syvende och sist deltar och svarar på våra spörsmål. Så vi kan regna ut svar-respons eller svar-procent genom att ta nettoutvalget och dela på bruttoutvalget. Och så tar vi gånger 100% så får vi det i procent. I boken så står följande tal så att 80-90% är en svärt höjt svar-procent.

Får man en sån svarprocent så ska man vara väldigt förnöjd. Man brukar säga att cirka över 50% är acceptabel men alldeles idag så får vi problem med generalisering. Att få en svarprocent på 30-40% är vanlig men det ger oss ju problem när vi ska snacka om statistisk säkerhet och generalisering. Det är inte vanligt att få ändå lavere svarprocent med. Och så kan vi tänka på det när vi har vårt utvalg.

Om vi sänder ut en spörundersökning till svårt många människor så är det en stor risk för att vi ändrar upp med en lav svarprocent. Det gör att det som vi kanske tänkte oss var ett tillfälligt utvalg, egentligen blev ett sånt där folk meldde sig på om de är intresserade. Så vi får inte helt styring över utvalget om vi gör det på den måten.

Så här må man vara försiktig. Vi kan då tänka igenom vilka strategier vi kan ha för att få störst möjlig svarprocent. Om vi ska sända nummer ut så bör vi göra det i en period när vi tror att folk är tillgängliga och har tid till att svara.

Om vi ringer runt i folk så må vi göra det på ett gott tidspunkt. Så vi kan pröva att få en större svarprocent genom att vara lur. Men vi må tänka på att det är många som inte har lyst att svara. Det är många som har... En liten sån overload av spörundersökelser som man får sända till sig varje gång man har varit i en butik omtrent.

Så det är inte säkert att folk har lyst att svara. Det är också så att folk som är intresserade vill ju i större grad svara på något. Och då kan ju det leda till att vi inte helt får ett sånt tillfälligt utvalg som vi önskar oss.

Så det är många problem här. Och det här är sånt som man må värdera och man må gärna skriva om det i en rapport. Om det är sånt man har. ett projekt där det här ska presenteras i eftertid.

Om vi känner till hur viktiga variabler fördelas i en population då kan vi göra en bortfallsanalyse när vi har samlat in våra data. Här har vi ett exempel som är ifrån en rapport där det är gjort en undersökelse bland ganska många allmänläger. Här ser vi i en kolonne att det är spurt Det här är utevalget. Och så ser vi här att vi har den virkliga fördelningen bland alla läger.

Och här kan man ju sammanligna. Hur många är det här? Vad är det för andel? Vi ser att många av de här variablerna så är fördelningen i utevalget, den som är orange, den orange kolonnen här, är likt det som vi ser i population som är den gröna. Så här kan vi ju själv värdera när vi läser den här artikeln.

Om det här har varit ett bra utvalg och om det är någon av de här som är där fördelningen är annerledes. Det är större risiko att vi får utvalgsfejl om vi har små utvalg. Så om vi har många respondenter så vill den här risikoen bli mindre. Väckting. Om det är så att avvikning mellan utvalg och population är stort så kan vi väckta resultatet.

Men då må vi känna till. fördelningen av den aktuella variabeln i population. Det kan ofta vara sådana som kön, alder och geografi där vi vet hur fördelningen är.

Här har vi ett exempel som kommer från boken där vi har gjort en undersökelse och spurt folk om hur de har stämt i ett valg. Vi vet att fördelningen av kvinnor och män i population är cirka 50% på var. Men i det här utvalget så ser vi att det är 40% i utvalget som är kvinnor och 60% som är män.

Då kan vi regna ut en väckningsfaktor här genom att ta andel i population delt på andel i utvalget. Ofta kanske man ville ha skrivit 0,5 delt på 0,4 istället. Men det här blir riktigt.

Vi får en väkt här så att resultaten från kvinnor ska väktas höjare än från män. För det är för få kvinnor i det här utvalget. Så här kan det se ut när vi driver på med väckning. Vi vet att... väkt för kvinnor här, det blir 1,25.

Och så har vi tält upp att det var 8 i utvalget som stämte på höjre, för exempel. Då kan vi justera det här genom att multiplicera med den här väktfaktorn. Och se att om det hade varit en fördelning som hade varit riktig här, att det hade varit lika många kvinnor som män, så ville det varit 10 kvinnor som svart att de stämte höjre.

Och det ville ha varit 15 män. Så att... Antalet kvinnor justeras lite upp och antalet män justeras lite ned. Så vi kan göra det så här med det om vi känner till hur variabeln är fördelt.

Vi har sett på hur man kan definiera population till en undersökelse och göra ett utvalg på en god måte. Så nu ska vi gå vidare och se på variabler som vi ska undersöka. Alltså vad är det vi egentligen ska samla in data om?

Till att börja med är det så att en god spörreundersökning må vara gott förankrad i den problemstilling vi har i vår projekt eller undersökning. En problemstilling eller ett forskningsspörsmål definierar vi som ett spörsmål som blir ställt med ett bestämt förmål på en så precis måte att det lär belysa genom bruk av samfundsvetenskapliga metoder. Detta är ju detsamma som när vi har kvalitativ metod.

En problemstilling eller ett forskningsspörsmål kan gärna vara formulert som ett eller fler spörsmål som vi önskar att finna svar på. Men det kan också vara ett tema vi önskar att finna ut om eller en hypotes som vi önskar att testa. Så en god problemstilling är avgränsat, precis, tydlig och spissete.

Och vi kan gärna formulera den som spörsmål. Etterpröbarheten blir ju mycket lättare att checka. om vi har ett spörsmål. Då kan vi se efterpå, har vi fått svar på det vi egentligen lurte på?

När vi lagar en spörrundersökelse så är det många ting vi kan spöra om. Men det vi spör om, vill det ge oss svar på det vi egentligen är ute efter? Begrepper har vi också haft dem i kvalitativ metod. När vi ska börja laga en spörrundersökelse så måste vi först tänka igenom om det är några viktiga nökelbegrepper som vi har som är knyttet till temat.

problemstillingen. Ett exempel som jag ska ta här är om vi önskar att göra en undersökelse av studenters matvanor. Det är ju många ting vi kunde spara om.

Och där har vi försäljning begrepp här som kan vara viktig att se på. Matvanor, det är ett sådant ord som vi brukar med, men vad betyder det egentligen? Om man ska bryta det lite ner och kunna ställa ett konkret spörsmål om det. När vi snackar om att mat är billig eller dyr så må vi kanske avgränsa det lite mer konkret. Det kan vara andra ting som näringsinnehåll och hälsotillstånd.

Vår matvanor påverkar skolprestation. Vi har många begrepp som vi tänker att vi sköner vad det här betyder. Men om vi ska ställa spörsmål om det här så är det otroligt viktigt att vi försikrar oss om att den som svarar på spörsmålet sköner vad vi har ment. Så att man inte har en försäljlig förståelse för några av de här begreppen. Så det är att sätta sig ner och skriva upp vilka begrepp som är viktiga och pröva att formulera goda spörsmål.

Kanske må vi in och förklara ett begrepp i en spörundersökelse. Först förklara att med det här begreppet menar vi sådant och sådant och så ställer vi ett spörsmål. Det kan vara så att vi må dekomponera begreppet. Dela det upp och definiera hur vi har tänkt måla det här. För exempel kan vi se att ordet ungdom kanske vi ska dela upp i försäljning av aldersintervall.

Vad menar vi egentligen med det här? Och när vi snackar om att mat är billig så kan det ju vara så att vi önskar att sätta ett tal på pris på något. Eller kanske pröva att se i förhållande till inkomst. Om du brukar 50% av inkomsten på mat eller 40%.

Så det här kan vi tänka lite runt och kanske vara lite kreativ för att se Hur kan vi dekomponera begreppen så att vi kan ställa förnuftiga spörsmål om det här? Operationalisering är också något som vi snackat om i kvalitativ metod. Det betyder att göra målbart. Och för att ha stora norska lexikon så har vi följande definition. Det handlar om att formulera klara kriterier för hur enheter, begrepp eller sammanhänge ska representeras vid empiriska data.

Operationalisering av en variabel innebär vanligvis att klargöra hur målingen av variabeln ska genomföras. Och det kan ju vara lite av det vi såg med begrepp, att vi dekomponerar begrepp och finner fram till att detta är det. Detta ska vi spara om. Vi kanske ska ha fler spörsmål som går på hälsotillstånd och pröva att måla det här. Men det kan nog vara så att någon gång så är det fenomen som vi önskar undersöka.

Där det inte är säkert att vi kan ställa någon direkt spörsmål om det här. Och då kan det vara att vi måste bruka indikatorer. En indikator den säger indirekt något om det vi vill ha svar på. Eller vi tror att en... kan säga något om det vi önskar svar på.

Det här är några indikatorer och det är avhängigt av vad vi undersöker. Men inkomst är en sak som vi kan spara om. Vi vet att det kan påverka ganska mycket i livet. Samma med civilstånd, om man har barn eller inte. Det är saker som kan vara intressant att spara om.

Även om det inte är direkt i det vi undersöker så tänker vi att det kan påverka andra saker. Inkomsten påverkar vad vi har möjlighet att göra. Det kan påverka hälsan vår, hur mycket pengar vi brukar på mat eller allt möjligt.

Vi kan måla hur ofta man gör något. Vi kanske önskar att finna ut hur viktigt något är för en viss grupp människor. Då kan vi fråga om sådana saker. Hur ofta gör du detta?

Eller hur mycket pengar brukar du på detta? indikatorer på om man syns något är viktigt, om det är något som blir värdesatt och som har stort fokus. Till slut när vi har gjort den här jobben med operationalisering, vi har sett på på förskälliga begrepp, vi har prövd att formulera några spörsmål eller funderat ut hur vi ska måla saker.

Det är inte säkert att vi måste spara om saker, vi kan finna ut information på förskälliga måter kanske. på Statistiskt centralbyrå eller observation eller något annat. Men det vi ändå upp med till slut är variabler. Det är alltså de egenskaper som undersökes eller svar på de spörsmål som vi ställer till respondenten.

Det är sådant som kan anta två eller flera värdier. Så det här är något som vi kan måla, sätta ett tal på eller sätta i olika kategorier. Här har vi ett antal exempel på variabler som vi ofta spör om i spörrundersökningar.

Vi ser att det här är olika typer av variabler. Några av dem är inkomster eller alder. Det kan vi lätt sätta ett tal på.

Vi tjänar så många pengar eller är så många år gammal. Könn är kategorier. Skostörelse kan vi ange i skostörelser och nummer.

En karaktär på en pröve kan ju vara det, för exempel från A till F. Så det är försäljtyper av variabler. Och vi snackar om försäljtyper av målnivå. Så det laveste nivået är det vi kallar för kategoriska variabler eller nominala variabler.

Det är för exempel kön, utdanning och andra sådana spörsmål. Det här är de kategorier som är gensidigt uteluckande. Alltså man kan bara hucka av för...

en av kategorierna. Sådana variabler kan vi kategorisera. Vi kan bara säga att det var så många som valde det alternativet och så många som valde det andra.

Vi kan ha flera möjliga kategorier här. Ordinalnivå är nästa. Där kan vi arrangera de här försäljade svaren.

Men det är inte precis avstånd mellan variablerna. För exempel kan vi spara om man är svärt oenig, lite oenig eller till svärt enig. Vi kan av och till se att vi önskar ge ett svar på en skala från 1 till 5. Så vi kan sätta ett tal på det, men det är ju inte så att vi kan se att jag var dobbelt så enig som någon annan.

Eller att vi kan se att avstånden mellan svärt oenig och lite oenig är lika stor som avstånden mellan neutral och lite enig. Det är ju inte säkert att vi har fem nivåer, det kan vara sju eller tio eller något annat. Intervall och förhållstal är när vi sätter tal på ting.

Det är sådana variabler som alder, antal timers sömn per natt, lön, allt möjligt. Här kan vi arrangera och se att det där var ett lavere värde i den en höjare men avstånd mellan variablerna vill ågi mening. Vi kan se att någon har dobbelt så höj lön som någon andra. När det är intervall så har vi inte något naturligt 0-punkt. För exempel gäller det för skostörelse och kanske temperatur i grader Celsius där vi har en skala som vi går efter.

Vi kan av och till samla in förhållstal, för exempel på alder och så kan vi laga aldersintervall. efterpå. Så intervall och förhållstal går lite in i varandra och det är ofta inte så viktigt att vi sköner så stor förskäl på dem.

Avhängigt av vilket målnivå vi har på det vi nu samlar in av data så är det försäljning som vi kan regna ut. Om vi ser på centralmål för nominale variabler så kan vi se på den vanligaste värdigen. Vi kan inte regna ut någon genomsnitt här. Vi kan bara se att det var fler män än kvinnor som svarta här.

För ordinal nivå så kan vi se på median, alltså den mittersta värdigen. Vi kan också se på typetal, alltså den vanligsta värdigen. Men för intervall och förhållstal kan vi regna ut genomsnitt, vi kan regna ut median.

Vi kan också se på typetal, så med förhållstal har vi alla möjligheter till beräkningar på alla möjliga måter. När det gäller statistiska analyser, så blir vi obegränsade om vi har ett lavere målenivå. Så för nominale variabler så kan vi laga kryss-tabeller och vi kan genomföra en kikvadrat-test som det finns en annan video på.

Vi kan i någon tillfälle bruka nominale variabler som dummy-variabler i regression. Så det kan man göra. För ordinal nivå så kan vi laga kryss-tabeller och kikvadrat-test. Vi kan bruka... ordinal nivå i regression.

Det är egentligen inte helt riktigt men det är fullt möjligt. Eller som en dummyvariabel. Men för intervall och förhållstal så kan vi göra konfidensintervall, vi kan genomföra alla möjliga försäljningstest, Z-test, T-test. Vi kan sammanligna grupper med paret och utparet T-test.

Vi kan genomföra en regression, vi kan genomföra egentligen alla möjliga ting. Så att för vår del när vi tänker Ett skritt vidare, vi ska genomföra en dataanalys här efterpå. Så vill det vara positivt för oss att få höjst möjlig målnivå. Eftersom det vill ge oss mer information, mer detaljert information. Och ge oss fler möjligheter till statistiska analyser.

Vi ser ju det att kan vi genomföra en t-test istället för en t-kvadrattest. Så kan vi se något mycket mer precis om våra hypoteser. Så det är positivt för oss, men det är ju inte allt som vi kan måla på den måten.

Så vi måste ju åtenka oss om vad är förnuftigt? På vilken måt är det förnuftigt att måla den här variabeln? Och vad kan vi egentligen finna ut av?

Det är en risiko om vi samlar in för detaljerade data med att vi tror att vi vet något väldigt exakt. Om vi för exempel lagar en ordinalskala med många försäljningsnivåer så verkar det kanske som att vi har fått väldigt detaljert information. Men hur är det för den som ska svara på det här?

Ge det mening att ha... tio nivåer eller blir det bara en ren jättning från den personen? Kanske det hade varit mer förnuftigt att ha tre nivåer, för det är mycket lättare att svara på.

Så man ska försöka få ett högt målenivå, men inte överdrivet.

Transcript for:Enkätundersökning: Urval och metodik

Transcript for:
Enkätundersökning: Urval och metodik