Statistiek

marcia007

De vraag is als volgt...

Algemeen wordt verondersteld dat een bepaalde genetische afwijking bij een specifiek hondenras bij 40% van de teven voorkomt. Om dit te staven worden lukraak 15 teven van het hondenras geselecteerd en men vindt slechts bij 3 teven de genetische afwijking.

A: Kan men, gebaseerd op dit resultaat, de hypothese verwerpen dat de genetische afwijking bij teven van het specifieke hondenras 40% bedraagt ten voordele van de hypothese dat het voorkomen van de genetische afwijking minder frequent is (

= 0,05)?

B: Wat is de type II fout als het werkelijke percentage van voorkomen van de genetische afwijking 10% bedraagt?

Ik ben zover gekomen:A:

n=15

= 0,4

(15 boven 0) * 0,4^0 * 0,6^15 = 0,00047

(15 boven 1) * 0,4^1 * 0,6^14 = 0,0047

(15 boven 2) * 0,4^2 * 0,6^13 = 0,02194

Als je er nog een waarde neemt zit je boven de 0,05 dus kan je daaruit halen dat het kritieke gebied: X < 3

Maar hoe mag je hier een consequentie aan binden? En er wordt ook gevraagd naar de P-waarde, maar in dit geval zou ik niet weten hoe die omzetting gemaakt moet worden. Volgens het antwoordenboek zou de P-waarde trouwens 0,0905 moeten zijn.....

B:

](*,) = 0,1

(15 boven 0) * 0,1^0 * 0,9^15 = 0,20589

(15 boven 1) * 0,1^1 * 0,9^14 = 0,34315

(15 boven 2) * 0,1^2 * 0,9^13 = 0,26689

Dit is het kritieke gebied uit de vorige vraag met de nieuwe parameter. Volgens mij is de type II fout als 1 van deze waarden voorkomt terwijl de nulhypothese aanvaard wordt. Dus dan zou de kans erop toch de opgetelde kans hiervan moeten zijn(0,81593)? Volgens het antwoordenboek (waar geen uitwerkingen in staan) zou het antwoord 0,184 moeten zijn, wat de uitkomst van 1-0,81593 is. Ik snap deze stap niet zo goed.

Als iemand hier een helder woord over kan spreken.....GRAAG

JWvdVeer

Sorry, maar ik kan niet zo veel met die Π van je. Het probleem is dat ik niet snap wat jij er mee bedoeld. Ik ken deze enkel als een waarde van 3.14[...]. Graag dus even uitleggen wat jij onder dat ding verstaat. Ik begin het idee te krijgen dat jij daaronder de kans op succes verstaat. Of heb ik dat fout?

marcia007

Ohw, ik dacht dat

redelijk algemeen was, maar ik bedoelde er inderdaad de kans op succes mee.

My bad ](*,)

Gesp

marcia007 schreef:A: Kan men, gebaseerd op dit resultaat, de hypothese verwerpen dat de genetische afwijking bij teven van het specifieke hondenras 40% bedraagt ten voordele van de hypothese dat het voorkomen van de genetische afwijking minder frequent is ( ](*,) = 0,05)?

...

n=15

= 0,4

(15 boven 0) * 0,4^0 * 0,6^15 = 0,00047

(15 boven 1) * 0,4^1 * 0,6^14 = 0,0047

(15 boven 2) * 0,4^2 * 0,6^13 = 0,02194

Als je er nog een waarde neemt zit je boven de 0,05 dus kan je daaruit halen dat het kritieke gebied: X < 3

Maar hoe mag je hier een consequentie aan binden? En er wordt ook gevraagd naar de P-waarde, maar in dit geval zou ik niet weten hoe die omzetting gemaakt moet worden. Volgens het antwoordenboek zou de P-waarde trouwens 0,0905 moeten zijn.....

Als je de kans op 3 successen meeneemt kom je precies op de P-waarde uit je antwoordenboek.

Je kun te de p-waarde interpreteren als: wat is de kans op 'dit resultaat of nog extremer' onder de aanname dat de nulhypothese waar is. Het is de som van de kansen op 3, 2, 1 en 0 maal de afwijking bij 15 willekeurig geselecteerde honden.

Die kans is dus 0.09..., en dat is groter dan 0.05

marcia007

Als je de kans op 3 successen meeneemt kom je precies op de P-waarde uit je antwoordenboek.

Zou je dat misschien even voor kunnen rekenen, want ik kom op een ander getal uit (0,02774)

JWvdVeer

Ik reken even met je mee:

\(n = 15, X \leq 3, p_1 = 0.1, p_2 = 0.4\)

\(P = \mbox{binomcdf}(n, p_1, X) = \mbox{binomcdf}(15, 0.1, 3) = 0.9444\)

\(P = \mbox{binomcdf}(n, p_2, X) = \mbox{binomcdf}(15, 0.4, 3) = 0.0905\)

Kom je hier verder mee? Overigens, is het niet praktischer om niet met de hand te rekenen? Dus gewoon je binomcdf-functie op je rekenmachine te gebruiken?

Ik zie overigens niet hoe ze komen aan die 0.184.

marcia007

Kom je hier verder mee?

Nee, sorry. Niet echt. ](*,) Ik gebruik die functie op m'n rekenmachine, maar ik kom echt op een heel ander antwoord uit. Jullie tellen toch ook gewoon P0, P1, P2 en P3 op?

En als je bij b het kritieke gebied optelt (=0,81593) en dat van 1 aftrekt kom je dus wel op 0,184, maar ik snap niet zo goed waarom ze dat doen.

JWvdVeer

Jij krijgt ook andere antwoorden als je exact dezelfde getallen invoert als ik? Lijkt me stug...?!

Binomcdf doet inderdaad de optelling. Ofwel:

\(\mbox{binomcdf}(n, p, X) = P(X = 0) + P(X = 1) + ... + P(X = N) = P(X \leq N)\)

marcia007

marcia007 schreef:(15 boven 0) * 0,4^0 * 0,6^15 = 0,00047

(15 boven 1) * 0,4^1 * 0,6^14 = 0,0047

(15 boven 2) * 0,4^2 * 0,6^13 = 0,02194

(15 boven 0) * 0,1^0 * 0,9^15 = 0,20589

(15 boven 1) * 0,1^1 * 0,9^14 = 0,34315

(15 boven 2) * 0,1^2 * 0,9^13 = 0,26689

Kom jij wel op deze antwoorden ook dan? Zo ja, dan zou mijn fout in de laatste berekening moeten zitten. (P (X=3) )

JWvdVeer

Kom jij wel op deze antwoorden ook dan?

Ja, die range aan antwoorden krijg ik ook. Maar ik snap niet waarom jij alles met de hand wilt uitrekenen. Tegenwoordig zit op de GR gewoon netjes een functie binomcdf en binompdf. De eerste is om een som van waarden uit te rekenen en de ander om losse waarden uit te rekenen. Dus vanwaar die obsessie om het met de hand te blijven doen?

marcia007

Uhm omdat ik anders niet weet hoe het moet? Ik gebruik wel de nCr functie, maar de rest vul ik zelf in. Maar dat is op zich niet het probleem aangezien ik toch wel op dezelfde waarden uitkom.......maar nu snap ik alsnog niet de som ](*,)

Gesp

Zou je dat misschien even voor kunnen rekenen, want ik kom op een ander getal uit (0,02774)

Voor 3 successen uit 15 bij kans 0.4 kom je op: 0.063388.

De kans op het gevonden resultaat of extremer, onder de aanname freq 0.4 = p(0) +p(1)+p(2)+p(3) = 0.00047..

0.0047.. + 0.0219.. + 0.063.. = 0.0905.

Interpretatie: als gemiddeld 4 op de 10 honden ziek zijn, kun je in 9% van de gevallen 3 of minder zieke dieren in een steekproef van 15 honden verwachten.

In statistiek wordt vaak de drempel 5% gebruikt ("als de kans op dit resultaat kleiner is dan 5%, dan is het significant"). Dit geval is hoger dan de drempel, en het resultaat kan dus passen bij een ziektefrequentie van 0.4.

JWvdVeer

Uhm omdat ik anders niet weet hoe het moet?

Tja, dat is snel genoeg uitgelegd.

Ik neem voor deze uitleg aan dat je een grafische rekenmachine (GR) hebt (bijv. TI-83, TI-84, ...). Dat vermoeden wordt enigszins gevoed door de mededeling dat je de nCr-functie gebruikt.

Voor deze opdracht type jij waarschijnlijk in je GR in:

Code: Selecteer alles

((15 nCr 0)* 0.4^0 * 0.6^15) + ((15 nCr 1) * 0.4^1 * 0.6^14) + ((15 nCr 2) * 0.4^2 * 0.6^13) + ((15 nCr 3)* 0.4^3 * 0.6^12)

Zoals je ziet is dat een hele waslijst. Grote kans dat jij (en ook ik) in deze lijst fouten maakt.

Als je nu de volgende variabelen in gedachten houdt:

n = aantal van de steekproef

p = kans op succes

X = aantal keer succes

Dan is in algemene zin de formule die je elke keer op je rekenmachine intypt:

Code: Selecteer alles

(n nCr X) * p^X * (1-p)^(n - X)

In LaTeX:

\(P = \left ( \begin{array}{c} n \\ X \end{array} )\right \cdot p^X \cdot (1-p)^{n-X}\)

Nu heeft je GR daar een functie voor. Namelijk binompdf (afkorting voor `binomial probability density function'). Deze kun je vinden in [2nd] [vars] [0]. Oftewel: DISTR:binompdf. De functievoorschrift voor deze functie is: binompdf(n, p, X).

Kun je hem niet in die lijst vinden, zoek hem dan maar op in je catalogus bij de B ([2nd] [0]).

De bovenstaande lap tekst kun je nu reduceren tot:

Code: Selecteer alles

binompdf(15, 0.4, 0) + binompdf(15, 0.4, 1) + binompdf(15, 0.4, 2) + binompdf(15, 0.4, 3)

Zoals je ziet maakt dat je leven al een stuk makkelijker.

Nu heeft men ooit heel goed begrepen dat dit soort berekeningen heel vaak voorkomen. En heeft men het goed gedacht om daar een functie voor te maken, die optelt van 0 tot X.

Dus stel dat jij wilt weten:

\(P(\leq 3)\)

met een succeskans van 0.4 (p) en een 15 steekproeven (n).

Dan kun je dat ook doen met de functie binomcdf (afkorting van `binomial cumulative distribution function'). De functievoorschrift hiervoor is binomcdf(n, p, x). Met dien verstande dat x de bovengrens is van de X-waarden die je wilt weten. Je kunt hem weer vinden het DISTR-menu: [2nd] [vars] [A].

Voor de opdracht die jij dus uit moest voeren kun je volstaan met:

Code: Selecteer alles

binomcdf(15, 0.4, 3)

. Deze levert mij het antwoord op van: 0.0905.

Stel dat je nu moet weten de kans

\(P(3 \leq X \leq 13)\)

met n=15 en p=0.4, dan moet je dus op jouw manier een hele lap code doorberekenen. Met binompdf moet je ook nog redelijk wat doen.

Met binomcdf doe je dat vrij eenvoudig: eerst bereken je de cumulatieve kans tot 13, daar trek je de cumulatieve kans van 2 vanaf. Ofwel:

\(P(3 \leq X \leq 13) = P(X \leq 13) - P(X \leq 2) = \mbox{binomcdf}(15, 0.4, 13) - \mbox{binomcdf}(15, 0.4, 2) = 0.973\)

Dit snap je?

Wetenschapsforum

Laatste berichten

Nieuwsberichten

Statistiek

Statistiek

Re: Statistiek

Re: Statistiek

Re: Statistiek

Re: Statistiek

Re: Statistiek

Re: Statistiek

Re: Statistiek

Re: Statistiek

Re: Statistiek

Re: Statistiek

Re: Statistiek

Re: Statistiek