Goedendag,
Per jaar komen er 4000 papieren binnen waarop of A of B kan staan (er zijn dus geen lege formulieren).
Deze informatie (A of B) wordt ingevoerd in een database.
Ik wil door middel van een steekproef uit de totale populatie (4000) bepalen of de informatie in de database wel betrouwbaar is. Dus, komt de informatie die in de database staat (A of B) wel overeen met de informatie (A of B) op het verkregen papier.
Mijn verwachting is dat in 95% van de gevallen de informatie overeenkomt.
De foutenmarge die ik wil toelaten is 5%. Betrouwbaarheidsinterval 95% lijkt me verder prima.
Als ik dan deze info op volgende site opgeef: http://www.journalinks.be/steekproef/, dus:
Foutenmarge: 5%
Betrouwbaarheidsinterval: 95%
Populatie: 4000
Spreiding: 5%
Dan krijg ik een vereiste steekproefgrootte van 72.
Klopt mijn beredenering? Of doe ik toch wat fout?
Alvast bedankt!
Grootte steekproef bepalen
Begonnen door: Arie Bombarie, 25 mrt 2010 11:45
#1
Geplaatst op 25 maart 2010 - 11:45
Help WSF met het vouwen van eiwitten en zo ziekten als kanker en dergelijke te bestrijden in de vrije tijd van je chip:
http://www.wetenscha...showtopic=59270
http://www.wetenscha...showtopic=59270
Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.
#2
Geplaatst op 26 maart 2010 - 22:09
Iemand die hier een handje kan toesteken?
ALS WIJ JE GEHOLPEN HEBBEN....
help ons dan eiwitten vouwen, en help mee ziekten als kanker en zo te bestrijden in de vrije tijd van je chip...
http://www.wetenscha...showtopic=59270
help ons dan eiwitten vouwen, en help mee ziekten als kanker en zo te bestrijden in de vrije tijd van je chip...
http://www.wetenscha...showtopic=59270
#3
Geplaatst op 28 maart 2010 - 00:43
Als je in dit geval uitgaat van een normale distributie moet je de steekproefgrootte n als volgt kiezen:
n >= ((2 x 1.96 x sigma)/0.05)^2
Wat jouw standaard deviatie (spreiding) sigma is, is mij niet helemaal duidelijk. Je drukt het hier uit in procenten, maar het zou een waarde moeten zijn die je bepaald aan de hand van de verwachting en de mean van je data set, wat weer afhankelijk is van de data distributie die je gebruikt.
Misschien kan je iets meer toelichten?
n >= ((2 x 1.96 x sigma)/0.05)^2
Wat jouw standaard deviatie (spreiding) sigma is, is mij niet helemaal duidelijk. Je drukt het hier uit in procenten, maar het zou een waarde moeten zijn die je bepaald aan de hand van de verwachting en de mean van je data set, wat weer afhankelijk is van de data distributie die je gebruikt.
Misschien kan je iets meer toelichten?
#4
Geplaatst op 28 maart 2010 - 11:38
Beste Sander,
Bedankt voor uw antwoord.
Alle informatie die ik heb van deze praktijksituatie:
Er wordt informatie van een formulier in een database gezet. De informatie in de database kan dus kloppen (overeenkomen met wat op het formulier staat) of niet kloppen (niet overeenkomen met wat op het formulier staat).
Ik wil nu graag een steekproef uitvoeren om in te schatten of de data die in de database te vinden is wel betrouwbaar is (dus overeenkomt komt met de broninformatie). In deze database staan totaal 4000 entries, echter omdat het vrij veel werk is om alle entries te gaan controleren met de broninformatie, wil ik een steekproef uitvoeren waarmee ik iets over de betrouwbaarheid van de complete database kan zeggen.
Nu wil ik dus bijvoorbeeld 100 database gegevens controleren met de broninformatie, dan kan ik berekenen in hoeveel procent van de controles in deze steekproef de informatie overeenkomt. Stel dat ik 100 entries gecontroleerd heb, en 2 daarvan komen niet overeen. Dan vind ik dus dat bij de steekproef 98% van de database gegevens van de desbetreffende steekproef correct overgenomen is. Maar met welk confidence level en interval kan ik nu iets over alle gegevens (4000) uit de database zeggen.
Alvast bedankt.
Bedankt voor uw antwoord.
Alle informatie die ik heb van deze praktijksituatie:
Er wordt informatie van een formulier in een database gezet. De informatie in de database kan dus kloppen (overeenkomen met wat op het formulier staat) of niet kloppen (niet overeenkomen met wat op het formulier staat).
Ik wil nu graag een steekproef uitvoeren om in te schatten of de data die in de database te vinden is wel betrouwbaar is (dus overeenkomt komt met de broninformatie). In deze database staan totaal 4000 entries, echter omdat het vrij veel werk is om alle entries te gaan controleren met de broninformatie, wil ik een steekproef uitvoeren waarmee ik iets over de betrouwbaarheid van de complete database kan zeggen.
Nu wil ik dus bijvoorbeeld 100 database gegevens controleren met de broninformatie, dan kan ik berekenen in hoeveel procent van de controles in deze steekproef de informatie overeenkomt. Stel dat ik 100 entries gecontroleerd heb, en 2 daarvan komen niet overeen. Dan vind ik dus dat bij de steekproef 98% van de database gegevens van de desbetreffende steekproef correct overgenomen is. Maar met welk confidence level en interval kan ik nu iets over alle gegevens (4000) uit de database zeggen.
Alvast bedankt.
Help WSF met het vouwen van eiwitten en zo ziekten als kanker en dergelijke te bestrijden in de vrije tijd van je chip:
http://www.wetenscha...showtopic=59270
http://www.wetenscha...showtopic=59270
0 gebruiker(s) lezen dit onderwerp
0 leden, 0 bezoekers, 0 anonieme gebruikers
Ook adverteren op onze website? Lees hier meer!
Nieuwsberichten
Gesponsorde vacatures
-
Hier ook uw vacature?
06-14
Nieuwe onderwerpen
-
Ik maakte een video over onts...
22-04
1
-
Koolstofchemie; substitutiere...
22-04
2
-
pH berekening
22-04
2
-
Calciumcarbonaat uitrekenen z...
22-04
14
-
kritische druk
21-04
4
-
bepaal basissen
21-04
2
-
beschouw de lineaire afbeelding
21-04
4
-
Hoogte schouw
20-04
1
-
Lichaam vrijmaken
20-04
1
-
Het geluid van de stem in je...
20-04
1