De eerste de beste steekproef en nu al fout!

Moderators: dirkwb, Xilvo

Reageer
Berichten: 2

De eerste de beste steekproef en nu al fout!

Hoi WSF leden,

Wij ontwikkelen veiligheids mechanisme voor roltrappen. Nu had ik een discussie met mijn collega's over kansberekening.

Stel dat een apparaat zodanig ontwikkeld is dat maar 1 op de 100.000 apparaten niet mag functioneren.

En stel dat je in de eerste de beste steekproef van 20 stuks een niet werkend apparaat aantreft.

Wat kan dit mij statistisch vertellen?

Je kan niet zomaar zeggen dat 5% niet werkt. Want die 1 op 100.000 kan je ook in het begin aantreffen. Maar zelf voel ik aan mijn water dat het dan vaker moet voorkomen.

Kan ik met de gegevens die ik nu heb al berekenen wat de kans is hoe vaak dit nog eens gaat voorkomen?

Graag uw mening / hulp.

Groet Bob

Gebruikersavatar
Berichten: 4.320

Re: De eerste de beste steekproef en nu al fout!

Het is zo dat dat 1 op 100 000 vast staat?

In dat geval is het gemakkelijk dan is het binomiaal verdeeld met n=20 en p=1/100000

Daarmee kan de kans worden berekend op 0 , 1 , 2 ,........... 20 defecten.

Hier zou ik het anders doen bereken de kans dat er geen defect is: P(X=0)=
\(\Bigl(\frac{99999}{100000}\Bigr)^{20}\)
Hier is dan gemakkelijk de kans te bereken dat er TENMINSTE 1 defect is op een trekking van twintig.
In de wiskunde zijn er geen Koninklijke wegen Majesteit.

Berichten: 2

Re: De eerste de beste steekproef en nu al fout!

Beste Tempelier,

Dank voor je hulp.

Het is natuurlijk niet per defenitie zo dat er 1 op de 100.000 defect is. Liefst is er natuurlijk geen enkele defect. Maar de kas daarop moet kleiner zijndan 1/100.000 Daarop is het apparaat ontworpen.

Nu tref ik bij de eerste steekproef van 20 stuks al 1 defecte aan. Dus vandaar mijn angst dat er nog wel veel meer defecten zullen zijn (=aanname) als ik nog meer steekproeven houd. Het kan natuurlijk toeval zijn dat ik in de eerste de beste steekproef die ene 1/100.000 ste aantref, maar nogmaals dat lijkt me stug dat deze dan de enige is die defect is.

Maar goed, met jou formule om te berekenen wat de kans is dat er GEEN defect is per steekproef: P(X=0)=(99999/100000)20=0.9998 kom ik dus uit op 99.98%

Dus 0,0002% dat er minimaal 1 defect is op de 20 (dus minimaal 20 op de 100.000 stuks is dan defect volgens de kansberekening)

Ik schetste al (onjuist natuurlijk) in mijn openings casus dat 5% defect zou kunnen zijn. Dit is 5.000 op de 100.000 dit is natuurlijk waanzinnig veel hoger dan de 20 die uit de berekening komt. Aan welke kant van de uiterste ligt de waarheid?

Kloppen mijn rekensommen? of maak ik een klassieke beginners fout? Waar ga ik nat?

Groet Bob

Gebruikersavatar
Berichten: 9.240

Re: De eerste de beste steekproef en nu al fout!

Je kunt het niet extrapoleren. Het is natuurlijk geen goed teken, maar met enkel 20 metingen kun je geen statistiek maken.

Gebruikersavatar
Berichten: 3.751

Re: De eerste de beste steekproef en nu al fout!

De nulhypothese is: hoogstens 1 van de 100000 roltrappen is defect. Dan is de kans dat je in de 20 stuks minstens 1 defecte roltrap aantreft 0,0002. Dat is ongeveer (net niet) een 3-sigma effect. Dat betekent dat de nulhypothese zeer onwaarschijnlijk is, en in bijna alle wetenschappelijke disciplines wordt de nulhypothese verworpen. Hoeveel metingen je hebt gedaan doet er daarbij absoluut niet toe, het is enkel de signigicantie (die 0,02%) die relevant is.

Of om de common sense aan te spreken: het is zeker niet onredelijk om eens te kijken of er niets aan de hand is.

Deze 0,02% heeft overigens niets te maken met 'minimaal 20 op de 100000 stuks is defect', het is gewoon een aanduiding van hoe onwaarschijnlijk deze situatie is als de nulhypothese waar zou zijn. Wat DPW zegt is overigens wel correct: als je zou moeten 'gokken' hoe vaak het zal voorkomen op 100000 gevallen, bekom je als beste gok 5000, maar de onzekerheid op deze uitspraak is zeer groot: het zou op basis van deze 20 metingen best wel 50 kunnen zijn, of 20000 (maar 1 is zeer waarschijnlijk niet juist).

Gebruikersavatar
Berichten: 3.751

Re: De eerste de beste steekproef en nu al fout!

Het 5% significantie-interval heeft als ondergrens dat 25 van de 100.000 apparaten defect zijn (oplossen van
\(1-(1-p)^20=0,05\)
). Voor de bovengrens moet je iets nauwkeuriger zijn (niet kijken naar de kans op tenminste 1 maar naar precies 1, voor grote p geeft dat een serieus verschil). Dus de tabellen erbij nemen, of de pc gebruiken.

edit: Mijn excuses trouwens, het is een 3.5-sigma effect. Dat maakt de verwerping van de nulhypothese nog meer aannemelijk.

Gebruikersavatar
Berichten: 4.320

Re: De eerste de beste steekproef en nu al fout!

WillieBob schreef:Beste Tempelier,

Dank voor je hulp.

Het is natuurlijk niet per defenitie zo dat er 1 op de 100.000 defect is. Liefst is er natuurlijk geen enkele defect. Maar de kas daarop moet kleiner zijndan 1/100.000 Daarop is het apparaat ontworpen.

Nu tref ik bij de eerste steekproef van 20 stuks al 1 defecte aan. Dus vandaar mijn angst dat er nog wel veel meer defecten zullen zijn (=aanname) als ik nog meer steekproeven houd. Het kan natuurlijk toeval zijn dat ik in de eerste de beste steekproef die ene 1/100.000 ste aantref, maar nogmaals dat lijkt me stug dat deze dan de enige is die defect is.

Maar goed, met jou formule om te berekenen wat de kans is dat er GEEN defect is per steekproef: P(X=0)=(99999/100000)20=0.9998 kom ik dus uit op 99.98%

Dus 0,0002% dat er minimaal 1 defect is op de 20 (dus minimaal 20 op de 100.000 stuks is dan defect volgens de kansberekening)

Ik schetste al (onjuist natuurlijk) in mijn openings casus dat 5% defect zou kunnen zijn. Dit is 5.000 op de 100.000 dit is natuurlijk waanzinnig veel hoger dan de 20 die uit de berekening komt. Aan welke kant van de uiterste ligt de waarheid?

Kloppen mijn rekensommen? of maak ik een klassieke beginners fout? Waar ga ik nat?

Groet Bob
Nee hoor je sommetje klopt precies.

Maar ik heb dus niet begrepen, je wilt een schatting maken van de kans op x aantal deffecten.

Daar zijn ook statische metoden voor het beste gebruik je hiervoor de T-verdeling die geeft een betrouwbaarheids interval terwijl de variantie niet bekend is.

Je moet dan wel aannemen dat het normaal-verdeeld is.

PS. Het is al eerder opgemerkt maat de steekproef is wel wat klein.
In de wiskunde zijn er geen Koninklijke wegen Majesteit.

Reageer