Sample size bepalen bij louter discrete variabelen en een bekende populatie

Moderators: dirkwb, Xilvo

Reageer
Berichten: 2

Sample size bepalen bij louter discrete variabelen en een bekende populatie

Hoi Wetenschappers,
 
Ik heb een vraagje. Ik ben een onderzoekje aan het doen, maar ik kom er niet helemaal uit. Ik heb al mijn statistiekboeken doorbladerd en gezocht op het internet, maar ik kan geen antwoord krijgen op mijn vraag.
 
Ik doe een onderzoek naar de herkomstgegevens van de followers van een aantal Twitter gebruikers. Ik heb een lijstje met de herkomstgegevens van alle followers van Twittergebruiker X. Echter, heeft niet elke follower aangegeven waar hij/zij vandaan komt. Ik weet maar van ongeveer 30 tot 50% waar zij vandaan komen. Nu vroeg ik me dus af of deze 30 tot 50% representatief is voor alle followers, oftewel de gehele populatie. Mijn basale statistiek kennis zegt van wel, mits de sample (de 30 tot 50%) groot genoeg is, maar misschien maak ik fout omdat de sample niet helemaal random (denk ik?).
 
Voor wie het niet duidelijk is, even een voorbeeldje:
 
Twitteruser 'X' (100.000 volgers):

NL: 10.000

UK: 5.000

DE: 15.000

BE: 5.000

Onbekend: 65.000
 
Kan iemand vertellen of ik goed of fout zit? En waarom? Is er iets van een formule/uitleg hoe ik dit kan bepalen? 
 
Ik hoor graag van jullie! Alvast bedankt!

Gebruikersavatar
Berichten: 467

Re: Sample size bepalen bij louter discrete variabelen en een bekende populatie

Je haalt nu twee zaken door elkaar: 1) welke sample size is groot genoeg voor het doen van betrouwbare uitspraken, en 2) missingness van data en de invloed op je resultaten.

Jouw probleem is een missende data probleem. Het probleem is dat je nooit 100% zeker weet of je de missende data 'missing completly at random', 'missing at random' of 'missing not at random' is (MCAR, MNAR, MAR). Slechts zelden is missingness MCAR. In de andere twee gevallen, MAR en MNAR, zal missingness wel invloed hebben op je resultaten en bias introduceren.

Berichten: 2

Re: Sample size bepalen bij louter discrete variabelen en een bekende populatie

Mijn vraag is inderdaad nogal dubbelzinnig. Wat betreft je uitleg is me een hoop duidelijk. Dan zit ik echter met nog een vraag, die je zelf ook al aangaf. Ervan uitgaande dat mijn populatie betrouwbaar is, hoe groot moet mijn sample dan zijn?

Reageer