Springen naar inhoud

P-value en hypothese testing


  • Log in om te kunnen reageren

#1

Milkyway

    Milkyway


  • 0 - 25 berichten
  • 3 berichten
  • Gebruiker

Geplaatst op 13 maart 2011 - 16:42

Beste allen,

Ik zit een beetje in de knoop met de p-value.

De p-value is de kans dat je een waarde tegenkomt, of extremer, als je verondersteld dat de nul hypothese waar is.
Over het algemeen gebruiken wij de p-value tegen een alpha (5% vaak) en verwerpen we onze nul hypothese als de p-value kleiner is als de alpha.

De alpha vind ik een duidelijk concept.
Stel One sample t-test
H0: u = 10
H1: u =! 10

Een alpha van bijvoorbeeld 5% betekent dat je de nul hypothese verwerpt als je een steekproef gemiddelde vind die, als de nul hypothese waar is, enkel 5% van de keren door willekeurige kans zou tegenkomen.
Je verwerpt dus dat het populatie gemiddelde gelijk is aan 10 als je een steekproef gemiddelde of te wel in de top 2.5% vind of in de bottom 2.5%.

De p-value is de kans dat je je gevonden steekproef gemiddelde, of extremer, vindt als de nul hypothese waar is.
Dit begrijp ik, maar ik begrijp eigenlijk niet waarom je dit precies wilt weten.
Wat maakt het uit wat de kans is dat je een steekproef gemiddelde, of extremer, vindt als het populatie gemiddelde 10 is? Het gaat er toch om wat ons daadwerkelijk verschil is van ons steekproef gemiddelde en ons veronderstelde populatie gemiddelde?
De enige reden die ik kan verzinnen is om het te vergelijken met de alpha, maar dat is het enige...
Het gegeven "De kans dat ik een steekproef gemiddelde van 14 OF EXTREMER als ik veronderstel dat mijn populatie gemiddelde 10 is" zou mij vrij weinig interesseren. Bij een two-tailed test vind ik dit dus nog raarder. Dan is de p-value de kans dat je 14 of hoger, of 6 of lager tegenkomt, als je verondersteld dat de nul hypothese waar is.

De andere methode vind ik veel begrijpelijker (t-calculated en critical values) Je kijkt naar de alpha en kijkt hoeveel standaardafwijkingen ik maximaal mag afwijken van het veronderstelde populatie gemiddelde voordat ik zeg "Dit is een significant verschil". Wijkt ons gevonden steekproef gemiddelde meer standaardafwijkingen af dan wat wij als kritieke grens beschouwen, verwerp h0.

Merk dat ik mij aardig irriteer dat ik dit niet begrijp, terwijl dit toch de basis is!

Het is een aardig verhaal geworden, ik hoop dat mensen mij erop kunnen wijzen waar mijn gedachten de verkeerde kant opgaan.

Veranderd door Milkyway, 13 maart 2011 - 16:44


Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

Drieske

    Drieske


  • >5k berichten
  • 10217 berichten
  • Moderator

Geplaatst op 13 maart 2011 - 18:30

De p-value is de kans dat je je gevonden steekproef gemiddelde, of extremer, vindt als de nul hypothese waar is.
Dit begrijp ik, maar ik begrijp eigenlijk niet waarom je dit precies wilt weten.
Wat maakt het uit wat de kans is dat je een steekproef gemiddelde, of extremer, vindt als het populatie gemiddelde 10 is? Het gaat er toch om wat ons daadwerkelijk verschil is van ons steekproef gemiddelde en ons veronderstelde populatie gemiddelde?

Wat deze p-waarde zo nuttig maakt, is dat ze "algemener" werkt dan het op voorhand kiezen van een alpha (of daarbij samenhangend: aanvaardingsgebied). Stel je vindt een p-waarde van 0,50; dwz dat je 50% kans hebt om een extremer dan het steekproefgemiddelde te vinden (als H0 waar is). Dat zegt jou dan toch dat het vinden van een extremere waarde (dan het gemiddelde) zeer aannemelijk is? Je hebt namelijk 50% kans hierop. Vergelijk dit nu met een p-waarde van 3%.

Uiteraard ga of kun je dan deze p-waarde gebruiken om een H0-hypothese te verwerpen of aanvaarden. Maar stel dat ze 4.99% is. Als jij op voorhand je alpha definieert en geen exacte p-waarde berekent, weet je niet eens of je ver van deze alpha afligt of niet. Dus op alpha = 5% zou jij H0 verwerpen. Echter, je zit zooooo dicht bij 5% dat dit bediscussieerbaar wordt (vind ik toch ;)). Maar met enkel alpha weet je dit niet. Was nu echter je p-waarde 0.01, dan lag dat toch helemaal anders?

Het lijkt mss wat dubbel wat ik hier zeg, maar waar het vooral op neerkomt: wij gebruikten de p-waarde steeds omdat je zo niet a priori moet kiezen op welk niveau je iets aanvaardt of verwerpt, maar je gewoon kunt vaststellen waar de grens van aanvaarden of verwerpen ligt.
Is dit een (ongeveer) antwoord op je vraag? Al merk ik wel dat ik, vrees ik, fel gewoon nog es hetzelfde heb gezegd.

Veranderd door Drieske, 13 maart 2011 - 18:32

Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

#3

Milkyway

    Milkyway


  • 0 - 25 berichten
  • 3 berichten
  • Gebruiker

Geplaatst op 13 maart 2011 - 19:02

Bedankt voor je antwoord.
Op één of andere manier had ik niet door dat het zeggen dat het vinden van een extremere waarden dan het gevonden steekproef gemiddelde, ook gelijk iets zegt over het gevonden steekproef gemiddelde zelf!

Zou je ook kunnen uitleggen waarom we bij een two-tailed hypothese (H1: u =! 10 bijvoorbeeld) we de p-waarde naar twee kanten bekijken (kan het even niet anders zeggen.) Dus in ons voorbeeld is de p-value de kans dat we 6 of minder vinden en 14 of meer?

#4

Drieske

    Drieske


  • >5k berichten
  • 10217 berichten
  • Moderator

Geplaatst op 13 maart 2011 - 19:33

Zou je ook kunnen uitleggen waarom we bij een two-tailed hypothese (H1: u =! 10 bijvoorbeeld) we de p-waarde naar twee kanten bekijken (kan het even niet anders zeggen.) Dus in ons voorbeeld is de p-value de kans dat we 6 of minder vinden en 14 of meer?

Snap je waarom je je alpha in 2 richtingen bekijkt bij een tweezijdige hypothesetoets? Want dat is voor een p-waarde toch juist hetzelfde... Het is niet enkel van belang of je "te groot" bent (of "te klein"), maar wel of je langs beide richtingen niet te veel afwijkt. Dit is niet echt koosjer gezegd, maar je snapt het idee hopelijk wel ;).

Als je engels het toestaat, is dit mss ook eens de moeite om te bezien.
Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

#5

Milkyway

    Milkyway


  • 0 - 25 berichten
  • 3 berichten
  • Gebruiker

Geplaatst op 13 maart 2011 - 20:52

Snap je waarom je je alpha in 2 richtingen bekijkt bij een tweezijdige hypothesetoets? Want dat is voor een p-waarde toch juist hetzelfde... Het is niet enkel van belang of je "te groot" bent (of "te klein"), maar wel of je langs beide richtingen niet te veel afwijkt. Dit is niet echt koosjer gezegd, maar je snapt het idee hopelijk wel ;).

Als je engels het toestaat, is dit mss ook eens de moeite om te bezien.

Die redenering had ik zelf ook, alleen vind hem op één of andere manier nog niet voldoende.

Grappige sidenote is dat ik op mijn universitaire studie het hoogste cijfer, voor het vak statistiek, heb gehaald van 500 leerlingen, maar blijkbaar deze stomme basis dingen geen eens wist.

Veranderd door Milkyway, 13 maart 2011 - 20:53


#6

Drieske

    Drieske


  • >5k berichten
  • 10217 berichten
  • Moderator

Geplaatst op 13 maart 2011 - 21:08

Wat is voor jou "niet voldoende" aan? Mss kan ik het in concreto toch nog wat aanvullen ;). Of iemand anders uiteraard.
Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.





0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures