De p-waarde is een belangrijk element in de statistiek voor het testen van hypothesen.
Er zijn conventies binnen de statistiek voor het rapporteren van p-waarden.
P-waarde en Significantieniveau
Het is problematisch om eenvoudigweg te stellen dat de p-waarde kleiner is dan het significantieniveau zonder verdere details.
Er is een duidelijk onderscheid tussen p-waarden zoals 0,049 en 0,001.
0,001 wijst op sterkere bewijskracht tegen de nulhypothese.
Bij zeer kleine p-waarden (bv. < 0,001) kan men volstaan met te melden dat de p-waarde "zeer klein" is.
Hypothesetoetsen en Onafhankelijkheid
Onafhankelijkheid van observaties is cruciaal (keuzes van proefpersonen zijn onafhankelijk).
Indien voldaan, kan de binomiale verdeling gebruikt worden voor het kansmodel.
De kans op een type 1-fout is gelijk aan alpha (significantieniveau) als de observaties onafhankelijk zijn.
Controle Over Type 1 Fout
Alpha is het significantieniveau dat de kans op een type 1-fout bepaalt.
We kiezen vaak een kleine alpha om de kans op een type 1-fout minimaal te houden.
Het is krachtig dat wij de controle hebben over de kans op een type 1-fout bij correcte toepassing van hypothesetesten.
Balans Type 1 en Type 2 Fouten
Een alfa van 0 zou de kans op een type 1-fout elimineren, maar verhoogt de kans op een type 2-fout tot 1.
Dit is ongewenst omdat we de nulhypothese nooit zouden kunnen verwerpen.
De uitdaging is om een balans te vinden waarbij beide type fouten minimaal zijn.
Type 2-fout: Kans om de nulhypothese niet te verwerpen als deze onjuist is.
Power van de Test
Power is de kans om de nulhypothese correct te verwerpen als de alternatieve hypothese waar is.
Factoren die de power beïnvloeden zijn belangrijk om te begrijpen.
Voorbeelden van experimenten met verzwaarde geldstukken illustreren hoe verschillen in waarschijnlijkheid de power kunnen beïnvloeden.
Experimenten en Conclusies
Simulatie van experimenten met verzwaarde geldstukken om het concept van power en fouten te verduidelijken.
Een hoger verschil van 0,5 (zoals bij 80% kans op kop) leidt tot sneller en betrouwbaarder bewijs tegen de nulhypothese dan een klein verschil (bijvoorbeeld 55%).