Springen naar inhoud

Steekproefgrootte


  • Log in om te kunnen reageren

#1

inlimbo

    inlimbo


  • 0 - 25 berichten
  • 6 berichten
  • Gebruiker

Geplaatst op 11 december 2007 - 13:25

Beste allen,

Ik zit met de volgende vraag:
Een productiebedrijf heeft een nieuwe machine die pakjes maakt. De norm van deze machine is dat er 1 op de 10.000 pakjes een afwijking mag hebben. Voordat ze de machine in gebruik nemen willen ze een test uitvoeren om te kunnen achterhalen of de machine de norm kan halen.

Hoeveel pakjes moeten ze testen om hier zeker van te zijn? Hoe ga ik hier mee om? Wat is de grootte van de steekproef om hier 95% zeker van te zijn, en hoe zit het dan met 99% zekerheid? In principe is de populatie (als hiermee gewerkt moet worden) oneindig.

Is er iemand die me hierbij kan helpen?
Bij voorbaat vriendelijk bedankt!

Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

EvilBro

    EvilBro


  • >5k berichten
  • 6703 berichten
  • VIP

Geplaatst op 11 december 2007 - 13:41

Huiswerk?

En wat heb je zelf al geprobeerd?

#3

inlimbo

    inlimbo


  • 0 - 25 berichten
  • 6 berichten
  • Gebruiker

Geplaatst op 11 december 2007 - 16:38

Ik heb gezocht naar informatie over steekproefgrootte en statistiek.
Hier wordt echter overal uitgegaan van een gemiddelde en een standaardafwijking.
Omdat het daar bij dit vraagstuk niet om gaat, vraag ik me af hoe ik hier mee om moet gaan.
Vriendelijke groet

#4

Rogier

    Rogier


  • >5k berichten
  • 5679 berichten
  • VIP

Geplaatst op 12 december 2007 - 08:27

Meestal gaan dit soort toetsen inderdaad uit van een normale verdeling met een bepaald gemiddelde en variantie. Of een onbekende variantie, dan kun je een t-toets gebruiken.

Om met slecht nieuws te beginnen: wat jij precies wil kan niet. Je kunt niet a priori een steekproefgrootte bepalen die een afwijking van 1 op 10000 met 95% of 99% zekerheid onderscheidt van ieder ander afwijkingsniveau daarboven. Ga gevoelsmatig maar na hoe groot de steekproef moet zijn om 1 op 10000 te onderscheiden van 1 op 9999. Of van k op 10000k-1 voor willekeurig grote k.

Wat wel kan is een bovengrens g bepalen zodat er, aannemende dat het afwijkingsniveau 1 op 10000 is, slechts 5% of 1% kans is dat er bij een steekproef van grootte n meer dan g pakjes afwijken. Indien dat toch gebeurt kun je concluderen dat de aanname waarschijnlijk fout was (omdat de gevonden uitslag tť onwaarschijnlijk is onder die aanname) en dus dat het afwijkingsniveau in werkelijkheid hoger ligt, oftewel exit pakjesmachine.

Dit kan bij iedere steekproefgrootte n. Zonder verdere gegevens over de kansverdeling kun je ervan uitgaan dat het aantal afwijkingen binomiaal verdeeld is, met de gekozen steekproefgrootte n, en een foutmarge p waarvan je wilt toetsen of die (ten hoogste) 1/10000 is.

Weet je hoe een hypothesetoets werkt? Hier alvast een zet in de goede richting, er zijn vier variabelen die een rol spelen: het significantieniveau LaTeX (de kans dat je de machine ten onrechte afkeurt), het onderscheidend vermogen LaTeX (de kans dat je de machine ten onrechte goedkeurt), de steekproefgrootte n, en de bovengrens g voor het maximale aantal afwijkingen (je keurt de machine af als je meer dan g afwijkingen in je steekproef aantreft). Kun je de relatie tussen deze vier bepalen?
In theory, there's no difference between theory and practice. In practice, there is.

#5

inlimbo

    inlimbo


  • 0 - 25 berichten
  • 6 berichten
  • Gebruiker

Geplaatst op 12 december 2007 - 09:16

Bedankt voor je reactie! Hier kan ik zeker mee verder. Ik heb in een ver verleden wel eens met de binomiale verdeling en hypothese toetsen gewerkt, dus ik zal hier mee aan de slag. Zodra ik een antwoord heb zet ik het er hier op ter controle. Nogmaals vriendelijk bedankt voor de hulp!

#6

inlimbo

    inlimbo


  • 0 - 25 berichten
  • 6 berichten
  • Gebruiker

Geplaatst op 14 december 2007 - 11:28

Beste Rogier,
Ik moet bekennen dat ik er niet uitkom.

Dit zijn de gegevens en ik heb geen idee welke formules ik hierbij zou moeten gebruiken.

H0 = p = < 0,0001
H1 = p = > 0,0001

n = willekeurig
g = 1
Alpha = zelf vast te stellen, bijvoorbeeld %
Beta = afhankelijk van alpha?

Nu lees ik hier dat dit forum geen antwoordenmachine is, maar ik zou het erg op prijs stellen als je me van meer informatie zou kunnen voorzien, zodat ik hiermee verder kan.
Alvast bedankt!

#7

Rogier

    Rogier


  • >5k berichten
  • 5679 berichten
  • VIP

Geplaatst op 14 december 2007 - 13:10

LaTeX is de kans op meer dan g fouten, met p = 0,0001. Dat is dus gewoon een binomiale kans (hangt af van n en p), kun je die uitrekenen?

LaTeX is de kans dat je de machine ten onrechte goedkeurt. Dat is dus de kans op ten hoogste g fouten, met p>0,0001. Reken je ongeveer net zo uit als LaTeX , alleen hoe groot p in dit geval is weet je niet. Je kunt zelf een te grote waarde van p bepalen die je met redelijke zekerheid van p=0,0001 wil onderscheiden, bijvoorbeeld p=0,0002 of p=0,001.

Je stelt verder dat g=1 maar dat hoeft niet, als je een hele grote steekproef neemt kunnen er best meer dan 1 afwijkingen zijn, ook al is p=0,0001. Waarschijnlijk is g>1 ook wel nodig om een goede waarde voor LaTeX te krijgen, want bestaat geen steekproefgrootte die met p=0,0001 een hele kleine kans geeft dat er meer dan 1 afwijkingen zijn, en tegelijk met (bijvoorbeeld) p=0,0002 juist een grote kans. Dat is juist het onderscheid dat je wilt maken.

Dat afwijkingsniveau van 1 op 10000 is trouwens vervelend om mee te rekenen omdat je dan hele grote waarden krijgt. Probeer het vraagstuk anders eerst voor jezelf eens op te lossen met 1 op 10, daar worden de getallen een stuk behapbaarder van en voor je begrip hetzelfde.

Even in ťťn zin samengevat: je moet een zodanige steekproefgrootte n en bovengrens g bepalen, zodat de kans op meer dan g afwijkingen heel klein is als p=p0, en just heel groot als p=p1.
In theory, there's no difference between theory and practice. In practice, there is.

#8

inlimbo

    inlimbo


  • 0 - 25 berichten
  • 6 berichten
  • Gebruiker

Geplaatst op 17 december 2007 - 11:55

Ik vond de volgende formule om de steekproefgrootte te bepalen voor een steekproefplan.


n =[ {(zα :D (p0*(1-p0)) + zβ :D (p1*(1-p1))} / p1 - p0 ] ^ 2

Hiervoor heb ik de volgende gegevens:
p0 = 0,0001
p1 = 0,0002
α = 0,05
β = 0,95

Hoe bepaal ik nu de zα en zβ?
In principe heb ik geen problemen met het werken met die grote getallen, ik heb alleen elke keer het gevoel dat ik gegevens mis.

#9

Rogier

    Rogier


  • >5k berichten
  • 5679 berichten
  • VIP

Geplaatst op 17 december 2007 - 13:53

Als je met z-scores werkt dan gebruik je een normale benadering (je zoekt LaTeX en LaTeX dan op in een Z-tabel).

Dan maken de grote aantallen inderdaad niet uit, alleen vanwege de hele kleine waarden voor p is het hier de vraag of die normale benadering wel representatief is (en of dat zo is hangt juist mede af van n).
In theory, there's no difference between theory and practice. In practice, there is.

#10

Rogier

    Rogier


  • >5k berichten
  • 5679 berichten
  • VIP

Geplaatst op 17 december 2007 - 14:32

Kleine toevoeging, ter indicatie: met n=175000 en g=25 (en p1=0.0002) heb je ongeveer de gewenste LaTeX en LaTeX . Die waarden zijn gebaseerd op de echte binomiale kansen.

Veranderd door Rogier, 17 december 2007 - 14:33

In theory, there's no difference between theory and practice. In practice, there is.





0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures