Springen naar inhoud

Grootte steekproef bepalen


  • Log in om te kunnen reageren

#1

Arie Bombarie

    Arie Bombarie


  • >250 berichten
  • 682 berichten
  • Ervaren gebruiker

Geplaatst op 25 maart 2010 - 11:45

Goedendag,

Per jaar komen er 4000 papieren binnen waarop of A of B kan staan (er zijn dus geen lege formulieren).
Deze informatie (A of B) wordt ingevoerd in een database.

Ik wil door middel van een steekproef uit de totale populatie (4000) bepalen of de informatie in de database wel betrouwbaar is. Dus, komt de informatie die in de database staat (A of B) wel overeen met de informatie (A of B) op het verkregen papier.

Mijn verwachting is dat in 95% van de gevallen de informatie overeenkomt.
De foutenmarge die ik wil toelaten is 5%. Betrouwbaarheidsinterval 95% lijkt me verder prima.

Als ik dan deze info op volgende site opgeef: http://www.journalinks.be/steekproef/, dus:
Foutenmarge: 5%
Betrouwbaarheidsinterval: 95%
Populatie: 4000
Spreiding: 5%

Dan krijg ik een vereiste steekproefgrootte van 72.

Klopt mijn beredenering? Of doe ik toch wat fout?

Alvast bedankt!
Help WSF met het vouwen van eiwitten en zo ziekten als kanker en dergelijke te bestrijden in de vrije tijd van je chip:
http://www.wetenscha...showtopic=59270

Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

Jan van de Velde

    Jan van de Velde


  • >5k berichten
  • 44894 berichten
  • Moderator

Geplaatst op 26 maart 2010 - 22:09

Iemand die hier een handje kan toesteken?
ALS WIJ JE GEHOLPEN HEBBEN....
help ons dan eiwitten vouwen, en help mee ziekten als kanker en zo te bestrijden in de vrije tijd van je chip...
http://www.wetenscha...showtopic=59270

#3

Sander-Calculus

    Sander-Calculus


  • 0 - 25 berichten
  • 5 berichten
  • Gebruiker

Geplaatst op 28 maart 2010 - 00:43

Als je in dit geval uitgaat van een normale distributie moet je de steekproefgrootte n als volgt kiezen:

n >= ((2 x 1.96 x sigma)/0.05)^2

Wat jouw standaard deviatie (spreiding) sigma is, is mij niet helemaal duidelijk. Je drukt het hier uit in procenten, maar het zou een waarde moeten zijn die je bepaald aan de hand van de verwachting en de mean van je data set, wat weer afhankelijk is van de data distributie die je gebruikt.

Misschien kan je iets meer toelichten?

#4

Arie Bombarie

    Arie Bombarie


  • >250 berichten
  • 682 berichten
  • Ervaren gebruiker

Geplaatst op 28 maart 2010 - 11:38

Beste Sander,

Bedankt voor uw antwoord.

Alle informatie die ik heb van deze praktijksituatie:

Er wordt informatie van een formulier in een database gezet. De informatie in de database kan dus kloppen (overeenkomen met wat op het formulier staat) of niet kloppen (niet overeenkomen met wat op het formulier staat).

Ik wil nu graag een steekproef uitvoeren om in te schatten of de data die in de database te vinden is wel betrouwbaar is (dus overeenkomt komt met de broninformatie). In deze database staan totaal 4000 entries, echter omdat het vrij veel werk is om alle entries te gaan controleren met de broninformatie, wil ik een steekproef uitvoeren waarmee ik iets over de betrouwbaarheid van de complete database kan zeggen.

Nu wil ik dus bijvoorbeeld 100 database gegevens controleren met de broninformatie, dan kan ik berekenen in hoeveel procent van de controles in deze steekproef de informatie overeenkomt. Stel dat ik 100 entries gecontroleerd heb, en 2 daarvan komen niet overeen. Dan vind ik dus dat bij de steekproef 98% van de database gegevens van de desbetreffende steekproef correct overgenomen is. Maar met welk confidence level en interval kan ik nu iets over alle gegevens (4000) uit de database zeggen.

Alvast bedankt.
Help WSF met het vouwen van eiwitten en zo ziekten als kanker en dergelijke te bestrijden in de vrije tijd van je chip:
http://www.wetenscha...showtopic=59270





0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures