Steekproefgrootte

Moderators: dirkwb, Xilvo

Reageer
Berichten: 6

Steekproefgrootte

Beste allen,

Ik zit met de volgende vraag:

Een productiebedrijf heeft een nieuwe machine die pakjes maakt. De norm van deze machine is dat er 1 op de 10.000 pakjes een afwijking mag hebben. Voordat ze de machine in gebruik nemen willen ze een test uitvoeren om te kunnen achterhalen of de machine de norm kan halen.

Hoeveel pakjes moeten ze testen om hier zeker van te zijn? Hoe ga ik hier mee om? Wat is de grootte van de steekproef om hier 95% zeker van te zijn, en hoe zit het dan met 99% zekerheid? In principe is de populatie (als hiermee gewerkt moet worden) oneindig.

Is er iemand die me hierbij kan helpen?

Bij voorbaat vriendelijk bedankt!

Berichten: 7.068

Re: Steekproefgrootte

Huiswerk?

En wat heb je zelf al geprobeerd?

Berichten: 6

Re: Steekproefgrootte

Ik heb gezocht naar informatie over steekproefgrootte en statistiek.

Hier wordt echter overal uitgegaan van een gemiddelde en een standaardafwijking.

Omdat het daar bij dit vraagstuk niet om gaat, vraag ik me af hoe ik hier mee om moet gaan.

Vriendelijke groet

Gebruikersavatar
Berichten: 5.679

Re: Steekproefgrootte

Meestal gaan dit soort toetsen inderdaad uit van een normale verdeling met een bepaald gemiddelde en variantie. Of een onbekende variantie, dan kun je een t-toets gebruiken.

Om met slecht nieuws te beginnen: wat jij precies wil kan niet. Je kunt niet a priori een steekproefgrootte bepalen die een afwijking van 1 op 10000 met 95% of 99% zekerheid onderscheidt van ieder ander afwijkingsniveau daarboven. Ga gevoelsmatig maar na hoe groot de steekproef moet zijn om 1 op 10000 te onderscheiden van 1 op 9999. Of van k op 10000k-1 voor willekeurig grote k.

Wat wel kan is een bovengrens g bepalen zodat er, aannemende dat het afwijkingsniveau 1 op 10000 is, slechts 5% of 1% kans is dat er bij een steekproef van grootte n meer dan g pakjes afwijken. Indien dat toch gebeurt kun je concluderen dat de aanname waarschijnlijk fout was (omdat de gevonden uitslag té onwaarschijnlijk is onder die aanname) en dus dat het afwijkingsniveau in werkelijkheid hoger ligt, oftewel exit pakjesmachine.

Dit kan bij iedere steekproefgrootte n. Zonder verdere gegevens over de kansverdeling kun je ervan uitgaan dat het aantal afwijkingen binomiaal verdeeld is, met de gekozen steekproefgrootte n, en een foutmarge p waarvan je wilt toetsen of die (ten hoogste) 1/10000 is.



Weet je hoe een hypothesetoets werkt? Hier alvast een zet in de goede richting, er zijn vier variabelen die een rol spelen: het significantieniveau
\(\alpha\)
(de kans dat je de machine ten onrechte afkeurt), het onderscheidend vermogen
\(\beta\)
(de kans dat je de machine ten onrechte goedkeurt), de steekproefgrootte n, en de bovengrens g voor het maximale aantal afwijkingen (je keurt de machine af als je meer dan g afwijkingen in je steekproef aantreft). Kun je de relatie tussen deze vier bepalen?
In theory, there's no difference between theory and practice. In practice, there is.

Berichten: 6

Re: Steekproefgrootte

Bedankt voor je reactie! Hier kan ik zeker mee verder. Ik heb in een ver verleden wel eens met de binomiale verdeling en hypothese toetsen gewerkt, dus ik zal hier mee aan de slag. Zodra ik een antwoord heb zet ik het er hier op ter controle. Nogmaals vriendelijk bedankt voor de hulp!

Berichten: 6

Re: Steekproefgrootte

Beste Rogier,

Ik moet bekennen dat ik er niet uitkom.

Dit zijn de gegevens en ik heb geen idee welke formules ik hierbij zou moeten gebruiken.

H0 = p = < 0,0001

H1 = p = > 0,0001

n = willekeurig

g = 1

Alpha = zelf vast te stellen, bijvoorbeeld %

Beta = afhankelijk van alpha?

Nu lees ik hier dat dit forum geen antwoordenmachine is, maar ik zou het erg op prijs stellen als je me van meer informatie zou kunnen voorzien, zodat ik hiermee verder kan.

Alvast bedankt!

Gebruikersavatar
Berichten: 5.679

Re: Steekproefgrootte

\(\alpha\)
is de kans op meer dan g fouten, met p = 0,0001. Dat is dus gewoon een binomiale kans (hangt af van n en p), kun je die uitrekenen?
\(\beta\)
is de kans dat je de machine ten onrechte goedkeurt. Dat is dus de kans op ten hoogste g fouten, met p>0,0001. Reken je ongeveer net zo uit als
\(\alpha\)
, alleen hoe groot p in dit geval is weet je niet. Je kunt zelf een te grote waarde van p bepalen die je met redelijke zekerheid van p=0,0001 wil onderscheiden, bijvoorbeeld p=0,0002 of p=0,001.

Je stelt verder dat g=1 maar dat hoeft niet, als je een hele grote steekproef neemt kunnen er best meer dan 1 afwijkingen zijn, ook al is p=0,0001. Waarschijnlijk is g>1 ook wel nodig om een goede waarde voor
\(\beta\)
te krijgen, want bestaat geen steekproefgrootte die met p=0,0001 een hele kleine kans geeft dat er meer dan 1 afwijkingen zijn, en tegelijk met (bijvoorbeeld) p=0,0002 juist een grote kans. Dat is juist het onderscheid dat je wilt maken.

Dat afwijkingsniveau van 1 op 10000 is trouwens vervelend om mee te rekenen omdat je dan hele grote waarden krijgt. Probeer het vraagstuk anders eerst voor jezelf eens op te lossen met 1 op 10, daar worden de getallen een stuk behapbaarder van en voor je begrip hetzelfde.

Even in één zin samengevat: je moet een zodanige steekproefgrootte n en bovengrens g bepalen, zodat de kans op meer dan g afwijkingen heel klein is als p=p0, en just heel groot als p=p1.
In theory, there's no difference between theory and practice. In practice, there is.

Berichten: 6

Re: Steekproefgrootte

Ik vond de volgende formule om de steekproefgrootte te bepalen voor een steekproefplan.

n =[ {(zα :D (p0*(1-p0)) + zβ :D (p1*(1-p1))} / p1 - p0 ] ^ 2



Hiervoor heb ik de volgende gegevens:

p0 = 0,0001

p1 = 0,0002

α = 0,05

β = 0,95

Hoe bepaal ik nu de zα en zβ?

In principe heb ik geen problemen met het werken met die grote getallen, ik heb alleen elke keer het gevoel dat ik gegevens mis.

Gebruikersavatar
Berichten: 5.679

Re: Steekproefgrootte

Als je met z-scores werkt dan gebruik je een normale benadering (je zoekt
\(z_{\alpha}\)
en
\(z_{\beta}\)
dan op in een Z-tabel).

Dan maken de grote aantallen inderdaad niet uit, alleen vanwege de hele kleine waarden voor p is het hier de vraag of die normale benadering wel representatief is (en of dat zo is hangt juist mede af van n).
In theory, there's no difference between theory and practice. In practice, there is.

Gebruikersavatar
Berichten: 5.679

Re: Steekproefgrootte

Kleine toevoeging, ter indicatie: met n=175000 en g=25 (en p1=0.0002) heb je ongeveer de gewenste
\(\alpha\)
en
\(\beta\)
. Die waarden zijn gebaseerd op de echte binomiale kansen.
In theory, there's no difference between theory and practice. In practice, there is.

Reageer