Statistiek

Moderators: ArcherBarry, Fuzzwood

Reageer
Gebruikersavatar
Berichten: 95

Statistiek

Opgave

2. De prevalentie van een welbepaalde dierziekte in de populatie bedraagt 5%.

a. Wat is de kans dat in een steekproef van 20 dieren de proportie van

dieren met de ziekte groter dan of gelijk is aan 5%?


b. Wat is de kans dat in een steeproef van 200 dieren de proportie groter

dan of gelijk is aan 5%?


c. Een steekproef van 100 dieren geeft een proportie van 8%. Is de

populatieparameter begrepen in het 98% betrouwbaarheidsinterval?


Met b) heb ik een probleem.

Ik zou de oefening willen oplossen mbv P-pi/sqrt(pi*(1-pi)/n) (1)

Waarbij pi de prevalentie is, P de proportie.

Ik heb gecontroleerd of ik die formule überhaupt wel kàn gebruiken. Nl. n*pi(1-pi) > 5

Dit is een vuistregel opdat de steekproef wel voldoende groot is om deze formule te kunnen gebruiken.

Nu: Zoals je ziet, als je de waarden in de teller begint in te vullen in (1), dan kom je 0 uit...

Dan ga je kijken naar de standaard normaalverdelingstabel, en zie je dus (logisch), dat de kans 0,5 is. Maar dat is niet de juiste oplossing..

Het kan ook zo: P(X>=10) (want 0.05*200=10)

Dan kan je het uitwerken door van 1 de kansen af te trekken dat het minder dan 10 is (P(X=0);P(X=1);P(X=2); ... enz).

Dit neemt echter veel tijd in beslag..

Is er geen mogelijkheid om toch met (1) te kunnen werken?
Not everything that counts can be counted, and not everything that can be counted counts

Berichten: 1.116

Re: Statistiek

2b. Je hebt een populatiekans van 5%. Gezien de steekproef 200 dieren bedraagt, benaderd het binomiale model gewoon bijna exact de normale verdeling.

Als je dit weet kun je vrij eenvoudig het gehele dingetje oplossen:
\(\sigma = \sqrt{np(1-p)}\)
\(\mu = E(\overline{X}) = np\)
\(p = normalcdf(\mu, \infty, \mu, \sigma)\)
Tja, en ik zie ook wel in dat je hiermee op 50% uit gaat komen. Maar als dat niet het goede antwoord is, wat is dan wel het goede antwoord? Misschien kunnen we het geheel dan naar het antwoord toe redeneren?

Het enige wat ik mij kan bedenken, is dat je bij transformatie van binomiale verdeling naar de normale verdeling er op moet letten dat je afhankelijk van de vraagstelling nog 0.5 op moet tellen of af moet trekken van de grens. Dus in dit geval zou dat zijn:
\(p = normalcdf(\mu-0.5, \infty, \mu, \sigma)\)
. In de binomiale verdeling werk je namelijk enkel met gehele getallen (n). Deze komen overeen in de normale verdeling alle getallen die afgerond dat getal zijn (dus getal n uit de binomiale verdeling komt overeen met de reeks
\([(n - 0.5), (n + 0.5)\rangle\)
uit de normale verdeling). Maar dat zou naar mijn idee bij een dergelijke steekproef al bijna geen verschil meer moeten maken.

Succes!

Berichten: 1.116

Re: Statistiek

Overigens, waarom werk je niet alsnog gewoon weer met binomiale verdeling?

Je hebt een populatie van 200 dieren. 5% komt overeen met 10 dieren. De vraag: hoe groot is de kans dat er 5% (10) of meer dieren ziek zijn, komt overeen met: hoe groot is de kans dat er niet minder dan 5% van de dieren ziek is (0-9).

Ofwel:
\(P(X \geq 5%) = 1 - P(X < 5%) = 1 - binomcdf(n, p, X) = 1 - binomcdf(200, 0.05, 9) = 1 - 0.45 = 0.55\)
.

Overigens klopt deze niet helemaal met wat ik uit de normale verdeling krijg (krijg daar iets van 0.52 uit). Er was ook een bepaalde regel om mee te testen of je binomiale verdeling om mocht zetten naar normale verdeling.
In een groot aantal gevallen kan een verdeling benaderd worden door een geschikt gekozen normale verdeling. In het bijzonder in die gevallen waarin de centrale limietstelling van praktische toepassing is. Zo kan een binomiale verdeling met parameters n en p, voor grotere waarden van n en gemiddelde waarden voor p, benaderd worden door een normale verdeling met dezelfde verwachting en variantie als de binomiale, dus door een N(np,np(1-p))-verdeling.
In ons geval schort het er aan dat p veel te laag is. Maar er was nog een vuistregel die voor zover ik mij kon herinneren iets zij over dat de standaarddeviatie meer moest zijn dan een bepaalde waarde (20, o.i.d.?).

Zie ook Wikipedia over normale verdeling en Wikipedia over binomiale verdeling. In de laatste staat ook een bepaalde vuistregel (
\(np > 5\)
en
\(n(1-p) > 5\)
). Volgens die regel mochten wij onze binomiale verdeling transformeren. Maar gezien het verschil tussen de twee methoden, zou ik daar nog eens over nadenken. Ik heb overigens ooit een andere vuistregel geleerd. Je zou ook de voorgestelde Poissonverdeling nog eens uit kunnen proberen.

Gebruikersavatar
Berichten: 95

Re: Statistiek

Het juiste antwoord is 0.563, of zou het moeten zijn ;-). Een fout in het oplossingenbestand kan natuurlijk ook, alhoewel me dat het minst waarschijnlijk lijkt.

Maar tot nu toe blijf ik toch bij de uitkomst 0.5. Ik mag die formule gebruiken zoals ik in het begin zei, want die vuistregel is groter dan 5..

Jij al een oplossing gevonden :-)?
Not everything that counts can be counted, and not everything that can be counted counts

Berichten: 1.116

Re: Statistiek

\(P(X \geq 5\%) = 1 - P(X < 5\%) = 1 - binomcdf(n, p, X) = 1 - binomcdf(200, 0.05, 9) = 1 - 0.45 = 0.55\)
Deze had ik vannacht al ingepost. Alleen gezien ik vergeten was \ voor de %-jes te zetten, zat je alleen maar
\(P(X \geq 5\)
(kijk maar eens).

Ik kom overigens één procent tekort in vergelijking met dat antwoord. En ik weet vrijwel zeker dat dit het goede antwoord is (binomiale verdeling is in dit geval altijd nog beter dan de normale verdeling).

Ik weet niet of je je docent hier nog iets over kunt vragen? Misschien gewoon vragen hoe hij dit zou aanpakken en zijn aanpak hier posten?

Reageer