Springen naar inhoud

Basale vragen ivm P waarde en nul hypothese.


  • Log in om te kunnen reageren

#1

haaii

    haaii


  • 0 - 25 berichten
  • 4 berichten
  • Gebruiker

Geplaatst op 09 april 2013 - 13:21

Dag wetenschappers.


Hier een jonge man die een zeer laag opleidingsniveau genoten heeft. Heb hier een paar vragen waarvan ik hoop dat ik mij in de daarvoor bedoelde sectie bevind.

Mijn eerste vraag betreft de nul hypothese.

Iemand vertelde mij dat het niet kunnen verwerpen van de nulhypothese, de hypothese NIET waar maakt. allereerst klopt dit? en hoe moet ik dit opvatten. Want bij een nulhypothese ga je ervan uit dat 'het' NIET zo is. Dus als ik het goed begrijp meent de onderzoeker dat X geen effect heeft op Y en als blijkt dat er een effect is, dan weet ik het niet meer zo goed. Ik kan dit op twee manieren opvatten.

Er is "een effect" en de onderzoeker had geen voorspelt, zijn hypothese dat er geen effect is wordt verworpen.

Er is "een effect" dat maakt de hypothese waar. Net zoals bij een alternatieve hypothese wordt het dankzij het effect niet verworpen, het enige verschil zit hem in de verwachtingen van de uitvoerende onderzoeker.

Welk is juist?

En verder zou ik graag weten hoe je stap per stap een P waarde kan uitrekenen. Op wikipedia staat een formule maar zoals ik al zei heb ik daar niet de benodigde kennis voor. Kan mij voorstellen dat voor deze laatste vraag iets te veel werk vereist is en niemand daar die energie in wilt steken, dat begrijp ik. Al heel erg bedankt allemaal.


Groetjes,

jullie haaii.

Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

Dominus Temporis

    Dominus Temporis


  • >250 berichten
  • 620 berichten
  • Verbannen

Geplaatst op 09 april 2013 - 16:08

Hoewel ik er niet zo verrassend veel van begrijp, lijkt het me verstandig het voorbeeld op deze site te raadplegen:
http://nl.wikipedia....se_(statistiek) .

Jouw voorbeeld volgend (als ik de hele zooi begrijp):
De hypothese zegt dat X GEEN effect heeft op Y.
Heeft X geen effect op Y, dan is de hypothese waar, en de nulhypothese onwaar;
Heeft X wel een effect op Y, dan is de hypothese onwaar, en de nulhypothese waar..Denk ik...

Veranderd door Dominus Temporis, 09 april 2013 - 16:12

"The only reason for time is so that everything doesn't happen at once." - Albert Einstein

#3

Dominus Temporis

    Dominus Temporis


  • >250 berichten
  • 620 berichten
  • Verbannen

Geplaatst op 09 april 2013 - 16:13

Er is "een effect" en de onderzoeker had geen voorspeld, zijn hypothese dat er geen effect is wordt verworpen.


Deze is juist, me dunkt..
Ik hoop dat hiermee je vraag beantwoord is.
(Sorry voor de verbetering, ik heb een hekel aan dt-fouten ;) )

Veranderd door Dominus Temporis, 09 april 2013 - 16:17

"The only reason for time is so that everything doesn't happen at once." - Albert Einstein

#4

haaii

    haaii


  • 0 - 25 berichten
  • 4 berichten
  • Gebruiker

Geplaatst op 09 april 2013 - 16:33

Oke, heb die wiki pagina nog eens gelezen en denk dat ik nu een correct beeld heb van deze concepten. En ja sorry van dat dt foutje. Normaal maak ik er nooit! echt waar. Maar vandaag al de tweede keer dat me dit overkomt. Zal wel aan de vermoeidheid liggen. :mrgreen:

Over die P waarde zou ik nog graag een uitleg hebben. Want dat zelf weten uit te rekenen kan ik echt niet aan de hand van een formule.

#5

Dominus Temporis

    Dominus Temporis


  • >250 berichten
  • 620 berichten
  • Verbannen

Geplaatst op 09 april 2013 - 16:36

Sorry, maar m'n antwoord was gebaseerd op dat Wiki-tekstje...Ik vrees dat ik je daarom niet kan helpen met het berekenen van p-waardes.
"The only reason for time is so that everything doesn't happen at once." - Albert Einstein

#6

317070

    317070


  • >5k berichten
  • 5567 berichten
  • Moderator

Geplaatst op 10 april 2013 - 21:31

Over die P waarde zou ik nog graag een uitleg hebben. Want dat zelf weten uit te rekenen kan ik echt niet aan de hand van een formule.

Dat is een vraag dat helaas niet zo algemeen behandeld kan worden. Geef anders eens een voorbeeld van een hypothese, dan kunnen we een snel voorbeeldje geven van welke stappen je daarvoor moet zetten.
What it all comes down to, is that I haven't got it all figured out just yet
And I've got one hand in my pocket and the other one is giving the peace sign
-Alanis Morisette-

#7

Drieske

    Drieske


  • >5k berichten
  • 10217 berichten
  • Moderator

Geplaatst op 11 april 2013 - 10:10

Opmerking moderator :

Verplaatst naar statistiek.
Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

#8

hanzwan

    hanzwan


  • >100 berichten
  • 132 berichten
  • Ervaren gebruiker

Geplaatst op 12 april 2013 - 13:57

De H0 en H1 zijn dus hopelijk inmiddels bekend. Je kan inderdaad niet concluderen dat H0 dan dus maar waar is. Ik zal je een simpel voorbeeldje geven van een test dan wordt het misschien duidelijk:

Stel we hebben een medicijn en willen weten of dit medicijn bij meer dan 50% van de mensen over wie wij het testen echt geneest. We testen het bij 100 mensen en noemen X het percentage mensen waarbij het werkt. Nu is de H0 de 'uitgangssituatie' die willen we vaak graag verwerpen om h1 aan te tonen (nu dus aantonen dat het werkt).
In het algemeen zit het = teken in de H0;


H0: de kans op genezing is gelijk of minder dan 50 %
H1: de kans is groter dan 50%
(merk op dat we kleiner dan 50 ook in de nul doen, we moeten namelijk alle mogelijkheden , kleiner, gelijk en groter in de H0+H1 bevatten.)

Stel dat het bij de 100 mensen in 60 gevallen (60%) echt geneest. Dan kunnen we gegeven wat aannames over hoe het verdeelt is (in dit geval binomiaal) uitrekenen wat de kans is dat, gegeven dat H0 klopt, dus dat de kans maximaal 50 % is op genezing, er bij onze testgroep 60 genezingen zijn. . Dit is dus de P waarde.

Wat meer intuïtie:
De H0 is de uitgangssituatie, de situatie waar we vanuit gaan en die we dus meestal hopen te verwerpen. We gaan er in dit voorbeeld vanuit dat we niet veel weten en alleen maar kunnen zeggen, de kans op genezing is maximaal (in het gunstigste geval) 50%. Daarna observeren we iets, bijvoorbeeld 60/100 genezingen. Dit is niet wat we zouden verwachten in de H0 situatie (dan verwachten wij er 50 of minder). Echter, ook die 50% is maar een kans en zoals het woord kans al zegt, zit er onzekerheid aan. We verwachten er 50 maar zien er 60. Dit kan soms gebeuren puur door pech. Met een eerlijke munt gooien kan soms na 10 keer ook 9 keer kop laten zien, puur pech/geluk. Zeker bij kleine testgroepen is de invloed van pech/geluk redelijk groot. Een logische vraag die je jezelf nu zou kunnen afvragen is: stel nou dat het inderdaad echt maximaal 50% van de gevallen geneest, hoe waarschijnlijk is het dan dat wij het op 100 mensen testen en we er een stuk meer (60 , dus 60%) genezen? Als dit heel onwaarschijnlijk is, bijvoorbeeld een kans van maar 0.001% dan lijkt het logisch om te zeggen oké, dat is zoveel pech/geluk, dan moet onze aanname over die 50% dus waarschijnlijk fout zijn en moeten we concluderen dat de kans op genezing waarschijnlijk boven de 50% ligt. Die kans die hierboven beschreven is: de kans dat; "wanneer we van H0 uitgaan (de uitgaanssituatie) we als resultaat krijgen wat wij zojuist hebben geobserveerd" is precies de P-value/waarde. Dus een lage P waarde zegt: de kans dat dit klopt met je aannames van H0 zijn heel onwaarschijnlijk en dus is het logisch om ervan uit te gaan dat H0 fout is en daarmee H1 klopt. Als de P waarde heel groot is (bijv 80%) dan kun je dus concluderen dat dit behoorlijk vaak voorkomt als we uitgaan van de situatie onder H0, dus geen reden om te concluderen dat H0 fout is.

Als laatste opmerking, de P-waarde, die kans die je wilt uitrekenen, hangt heel erg af van wat er getest wordt. Hiermee bedoel ik dat verschillende processen heel verschillend verdeeld kunnen of zullen zijn en daarmee dus de P waarde heel erg afhangt van de specifieke situatie , zoals 317070 al liet weten

#9

haaii

    haaii


  • 0 - 25 berichten
  • 4 berichten
  • Gebruiker

Geplaatst op 14 april 2013 - 14:31

Heel erg bedankt voor jullie heldere uitleg.

Soms vraag ik mij af hoe significant een resultaat is. En hoe groot de kans is dat het uitbijters zijn. Vandaar dat het mij leuk leek om de p waarde te kunnen uitrekenen. Ik zal wel eens een specifieke vraag stellen omtrent de p-waarde van een onderzoek. Mits het een transparant onderzoek is waar alle relevante gegevens mede gepubliceerd zijn.

#10

hanzwan

    hanzwan


  • >100 berichten
  • 132 berichten
  • Ervaren gebruiker

Geplaatst op 15 april 2013 - 21:49

Hoewel dat misschien iets voor de hand liggends lijkt is dit vaak complex om goed te doen, zeker bij empirisch onderzoek. Soms merk ik zelfs dat de p-waarde die is uitgerekend complexer in elkaar zit dan dat de onderzoekers zelf door hebben (vooral bij sociale wetenschappen schrik ik er nog weleens van)

Het idee voor het uitrekenen van een P waarde in het algemeen is als volgt:

1. Een P waarde is een kans, je kunt alleen een kans uitrekenen wanneer je een verdeling van hetgeen je meet hebt of redelijk zeker kunt zijn dat iets lijkt op de verdeling die je voor ogen hebt.

2. Het is dus belangrijk om ervan uit te kunnen gaan dat hetgeen je meet en test dus ook daadwerkelijk deze verdeling heeft, en er dus niet voldoende bewijs is in de data om te concluderen dat het deze verdeling duidelijk niet is (het vervelende is, of het echt zo verdeeld is is zo goed als onmogelijk om aan te tonen).

3. Gegeven dit alles kan dan een P waarde worden uitgerekend.

Een aantal veel gebruikte verdelingen zijn de:
Normale verdeling, Student-T verdeling, Chi-kwadraat verdeling, F-verdeling.

#11

haaii

    haaii


  • 0 - 25 berichten
  • 4 berichten
  • Gebruiker

Geplaatst op 16 april 2013 - 12:21

Hoewel dat misschien iets voor de hand liggends lijkt is dit vaak complex om goed te doen, zeker bij empirisch onderzoek. Soms merk ik zelfs dat de p-waarde die is uitgerekend complexer in elkaar zit dan dat de onderzoekers zelf door hebben (vooral bij sociale wetenschappen schrik ik er nog weleens van)

Het idee voor het uitrekenen van een P waarde in het algemeen is als volgt:

1. Een P waarde is een kans, je kunt alleen een kans uitrekenen wanneer je een verdeling van hetgeen je meet hebt of redelijk zeker kunt zijn dat iets lijkt op de verdeling die je voor ogen hebt.

2. Het is dus belangrijk om ervan uit te kunnen gaan dat hetgeen je meet en test dus ook daadwerkelijk deze verdeling heeft, en er dus niet voldoende bewijs is in de data om te concluderen dat het deze verdeling duidelijk niet is (het vervelende is, of het echt zo verdeeld is is zo goed als onmogelijk om aan te tonen).

3. Gegeven dit alles kan dan een P waarde worden uitgerekend.

Een aantal veel gebruikte verdelingen zijn de:
Normale verdeling, Student-T verdeling, Chi-kwadraat verdeling, F-verdeling.


Je bedoelt dat bij medisch onderzoek bijvoorbeeld moeilijk kan uitgerekend worden wat de P waarde is omdat je niet altijd weet wat de normale hoeveelheid uitbijters zijn. Of uberhaupt wat de uitbijters zijn.

Van dat laatste die verdelingen zoals chi en F verdeling begrijp ik geen moer.

#12

hanzwan

    hanzwan


  • >100 berichten
  • 132 berichten
  • Ervaren gebruiker

Geplaatst op 16 april 2013 - 14:39

Een P waarde is een kans. Het heeft pas zin om over kansen te spreken wanneer je een idee hebt hoe iets verdeelt is. Dat wil zeggen, wat is de kans dat ik 2 keer achter elkaar kop gooi? Dat is uit te rekenen als ik aanneem dat de munt eerlijk is. Als ik vervolgens 100 keer gooi en 98 keer kop krijg kan ik mij afvragen of dit wel een eerlijke munt is, als ik er dan van uitga dat bij een normale munt die kans 50% is kan ik uitrekenen dat de kans op 98 keer kop zo goed als nul is (p waarde van bijna nul)

Het probleem zit hem erin dat je dus moet weten hoe de verdeling van hetgeen je berekent is. De P waarde hangt af van die verdeling. Neem bijvoorbeeld twee voorbeelden IQ en aandelenprijs.

Het IQ is (bij benadering) normaal verdeelt. Stel dat dit gemiddeld 105 is voor nederlanders met een standaardafwijking van 20. Dan als ik een groep mensen tegenkom met een gemiddeld IQ van 140 kan ik gaan afvragen: Hoe groot was de kans vooraf dat ik deze mensen tegen zou zijn gekomen? Dit omdat we de aanname maken dat het IQ (hetgeen we meten) op een bepaalde manier verdeelt is, daardoor kunnen we kansen echt uitrekenen, de P waarde is niks anders dan een kans op het tegenkomen van iets. Het heeft hier zin om over deze P waarde te spreken omdat we de verdeling weten of heel erg goed kunnen benaderen met die normale verdeling.

De prijs of winst van aandelen volgen geen normale verdeling, de echte verdeling is onbekend en wordt vaak op hele complexe manieren 'benadert' (wat vaak erg mis gaat). Omdat we de verdeling niet weten heeft het ook geen zin om over kansen te spreken als: "Wat is de kans dat Apple morgen 10% winst boekt." omdat de uitgerekende kans is gebaseerd op een 'veronderstelling' of 'gok' van de verdeling van de aandelenprijs. Die P-waarde is daarmee dus ook niet erg accuraat.

Ik hoop dat hiermee duidelijk is dat het uitrekenen van een P waarde erg afhangt van wat je meet en hoe hetgeen je meet verdeeld is. Het concept P-waarde is niet moeilijk, het uitrekenen van een P waarde is dus al snel behoorlijk complex omdat het vereist dat degene die het doet kennis heeft van kansrekening/statistiek en deze kennis kan toepassen om een verdeling voor hetgeen gemeten wordt af te leiden of in ieder geval te testen of de veronderstelde verdeling er genoeg op lijkt.

Veranderd door hanzwan, 16 april 2013 - 14:40






0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures