📊

Inzicht in P-waarde en Hypothesetesten

Nov 2, 2024

Notities over Rapportage van de P-waarde

Inleiding

  • De p-waarde is een belangrijk element in de statistiek voor het testen van hypothesen.
  • Er zijn conventies binnen de statistiek voor het rapporteren van p-waarden.

P-waarde en Significantieniveau

  • Het is problematisch om eenvoudigweg te stellen dat de p-waarde kleiner is dan het significantieniveau zonder verdere details.
  • Er is een duidelijk onderscheid tussen p-waarden zoals 0,049 en 0,001.
    • 0,001 wijst op sterkere bewijskracht tegen de nulhypothese.
  • Bij zeer kleine p-waarden (bv. < 0,001) kan men volstaan met te melden dat de p-waarde "zeer klein" is.

Hypothesetoetsen en Onafhankelijkheid

  • Onafhankelijkheid van observaties is cruciaal (keuzes van proefpersonen zijn onafhankelijk).
    • Indien voldaan, kan de binomiale verdeling gebruikt worden voor het kansmodel.
  • De kans op een type 1-fout is gelijk aan alpha (significantieniveau) als de observaties onafhankelijk zijn.

Controle Over Type 1 Fout

  • Alpha is het significantieniveau dat de kans op een type 1-fout bepaalt.
  • We kiezen vaak een kleine alpha om de kans op een type 1-fout minimaal te houden.
  • Het is krachtig dat wij de controle hebben over de kans op een type 1-fout bij correcte toepassing van hypothesetesten.

Balans Type 1 en Type 2 Fouten

  • Een alfa van 0 zou de kans op een type 1-fout elimineren, maar verhoogt de kans op een type 2-fout tot 1.
    • Dit is ongewenst omdat we de nulhypothese nooit zouden kunnen verwerpen.
  • De uitdaging is om een balans te vinden waarbij beide type fouten minimaal zijn.
    • Type 2-fout: Kans om de nulhypothese niet te verwerpen als deze onjuist is.

Power van de Test

  • Power is de kans om de nulhypothese correct te verwerpen als de alternatieve hypothese waar is.
  • Factoren die de power beïnvloeden zijn belangrijk om te begrijpen.
  • Voorbeelden van experimenten met verzwaarde geldstukken illustreren hoe verschillen in waarschijnlijkheid de power kunnen beïnvloeden.

Experimenten en Conclusies

  • Simulatie van experimenten met verzwaarde geldstukken om het concept van power en fouten te verduidelijken.
  • Een hoger verschil van 0,5 (zoals bij 80% kans op kop) leidt tot sneller en betrouwbaarder bewijs tegen de nulhypothese dan een klein verschil (bijvoorbeeld 55%).