Interpretatie centrale limietstelling

jones123

Ik heb een vraagje: is dit de juiste interpretatie van de centrale limietstelling?

Stel je hebt een dataset uit een steekproef met n = 60. Als je dan steeds weer een steekproef neemt uit die dataset met dezelfde grootte (bv. 35), en het gemiddelde ervan uitzet op een grafiek, bekom je bij benadering de grafiek van een normale verdeling.

Bedankt!

Xenion

Ik denk dat je het wel doorhebt, maar ik vind je uitleg niet zo duidelijk.

De centrale limietstelling zegt dat een som van stochastische variabelen in de limiet naar een normale verdeling gaat.

Stel dat je een (eerlijke dobbelsteen hebt). Als je daar heel vaak mee gooit en een histogram maakt van de uitkomsten dan zal je een uniforme verdeling zien verschijnen.

Als je nu per 'sample' 2x met een dobbelsteen zou gooien en maakt een histogram van de som van die twee uitkomsten, dan zal je een driehoek zien ontstaan.

Als je nog meer keren gooit per sample en je neemt dan de som, dan zal je zien dat dit steeds meer op een normale verdeling begint te lijken.

In de volgende figuur heb ik een uniforme verdeling tussen 0 en 1 genomen. Ik neem N samples uit de verdeling en tel ze bij elkaar op. Dit herhaal ik een aantal keer zodat ik een histogram kan tekenen. Voor N = 1 en 2 zie je die uniforme verdeling en driehoek die ik al vermelde en bij N = 10 zit er al duidelijk de vorm van de normale verdeling in. Daarin zie je dat die convergentie al vrij snel gaat (zelfs N = 5 begon er al erg op te lijken).

: clt.png (4.87 KiB) 935 keer bekeken

Als je het gemiddelde van een steekproef bepaalt dan maak je ook een som van verschillende samples. Als elk sample in je steekproef een onafhankelijke stochastische variabele is, dan geldt weer de centrale limietstelling. Om het gemiddelde te maken moet je sommeren. Het steekproefgemiddelde zal dus ook een normale verdeling volgen.

jones123

Xenion schreef: ↑di 15 jan 2013, 18:09
Ik denk dat je het wel doorhebt, maar ik vind je uitleg niet zo duidelijk.

De centrale limietstelling zegt dat een som van stochastische variabelen in de limiet naar een normale verdeling gaat.

Oke, maar ik ben met iets nog niet helemaal mee...

In mijn boek staat volgende definitie:

Als X1, X2, ..., Xn onafhankelijke variabelen zijn met dezelfde verdeling en met eindige variantie, zal Y = X1 + X2 + .. + Xn bij benadering normaal verdeeld zijn.

Zijn dan X1, X2, ...Xn dan de steekproefgemiddeldes van verschillende onafhankelijke steekproeven uit een populatie met dezelfde verdeling?

Xenion

Nee die hele rij X1 tot Xn is een steekproef: je neemt n samples uit een bepaalde verdeling. Als je het gemiddelde daarvan neemt Y = (X1+...+Xn)/n, dan zal Y in de limiet normaal verdeeld zijn en dit ongeacht de verdeling van de afzonderlijke Xi. De enige voorwaarde is dat ze onafhankelijk zijn van elkaar. (En nog wat subtiliteiten zoals eindige variantie enzo.)

Wetenschapsforum

Laatste berichten

Nieuwsberichten

Interpretatie centrale limietstelling

Interpretatie centrale limietstelling

Re: Interpretatie centrale limietstelling

Re: Interpretatie centrale limietstelling

Re: Interpretatie centrale limietstelling