statistiek - H0 toetsen

gloudie

Ik heb een opgave en daar kom ik maar gedeeltelijk uit.

Er staat:

Voorafgaand aan een onderzoek is door verschillende instanties de verwachting uitgesproken dat in de huidige situatie bij 30% van alle adressen van groenafval plaats vindt. Toets of deze verwachting juist is.

Er zijn 50 adressen in het onderzoek

dus 0,3 * 50 = 15 adressen

in de werkelijke gegevens staat dat er maar 10 adressen afvoeren

Vervolgens tekenen ze een kromme van gaus met N = 15

en links 0 en rechts 50

Dan staat er 1 t/m 8 niet

en vanaf 23 kan niet

De conclusie is H0 handhaven want 23 > 10 < 8

Mijn vraag hoe komen ze nu aan dat 1 t/m 8 en vanaf 23?

evilbu

Voorafgaand aan een onderzoek is door verschillende instanties de verwachting uitgesproken dat in de huidige situatie bij 30% van alle adressen van groenafval plaats vindt. Toets of deze verwachting juist is.

Ik begrijp deze nederlandse zin niet. Alle adressen van groenafval?

A.Square

Ik snap het ook niet helemaal, maar even vluchtig kijken leidt mij naar de binomiale verveling.

gloudie

Bij de som zit een bijlage en daar staan gegevens uit het computerprogramma SPSS bij. Vandaar die vraag over dat groenafval.

Binomiale verdeling klopt. Maar hoe toets je zoiets dan precies? De U uitrekenen lukt me en dan teken je die kromme van gaus. Maar dan?

sirius

Het antwoord wat hier gegeven is is ongeveer als volgt tot stand gekomen:

Stel dat 30% van de adressen inderdaad groenafval uitsorteert(?). Stel je een vaasmodel die gevuld is met knikkers, waarbij iedere knikker een adres voorstelt. Je grijpt nu 50 adressen uit de vaas(dus grijpen zonder terugleggen). Laat X het aantal adressen uit de gegraaide 50 zijn dat groenafval uitsorteert.

Om de kansverdeling voor X te berekenen maken we een aantal versimpelingen.

Ten eerste zeggen we dat omdat er veel meer knikkers in de vaas zitten dan we eruit pakken er weinig verschil zit tussen grijpen zonder terugleggen en grijpen met terugleggen. Immers de kans dat we bij grijpen met terugleggen twee keer dezelfde knikker pakken is erg klein.

Nu kunnen we X dus zien als het aantal keer kop als we 50 keer een muntje opgooien, waarbij kop 30% kans heeft. De kansverdeling voor X zal nu een binomiale verdeling met N=50, p=0,3 zijn.

Echter we doen nog een versimpeling. Hiervoor schrijven we X=Y1+Y2+Y3+++Y50. Waarbij Y1..Y50 de uitkomsten zijn van de verschillende keren opgooien van het muntje(kop=1).

Nu is er een handig wiskunde stelling die zegt dat als je N stochasten Y1..YN hebt, die onderling onafhankelijk gelijk verdeeld zijn, dat dan de verdeling van de som X=Y1+Y2++YN steeds meer op een Gaussische verdeling gaat lijken naarmate je N maar groot genoeg maakt. Dit heet de centrale limietstelling. De aanname die nu gemaakt wordt is dat N=50 inderdaad groot genoeg is.

Om nu te weten voor welke parameters we de gaussiche verdeling moeten berekenen kunnen we de verwachtingswaarde van X uitrekenen, deze moet gelijk zijn aan de verwachtingswaarde van de gaussiche verdeling die X beschrijft.

Omdat aangenomen is dat alle Y1..Y50 onafhankelijk zijn mogen we nu zeggen de de verwachtingswaarde van de som van Y1..Y50 gelijk is aan de som van de verwachtingswaardes van Y1..Y50. De verwachtingswaarde van Y1 is gelijk aan de van Y2...Y50 en is gelijk aan : 30%*1+ 70%*0=0,3. Dus de verwachtinswaarde van X=0,3+0,3+(in totaal vijftig keer)+0,3=15.

Ongeveer hetzelfde kunnen we doen voor de variantie van X. Deze is ook gelijk aan de som van de standaarddeviaties van Y1..Y50. De variantie van Y1 is wederom gelijk aan die van Y2..Y50, namelijk: 0,3-(0,3^2)=0,21. Dus de variantie van X = 50*0,21=10,5 en dus de standaard deviatie van X=sqrt(10,5)=ongeveer 3,24.

Kortom X is normaal verdeeld rond 15 met een standaarddeviatie van 3,24.

Vervolgens zou ik nu verder met te zeggen als H0 klopt dan is er een 99,5% kans dat 15 - 1,98*3,24 = 8,58 < X < 21,42 . Dus nu kun je met een betrouwbaarheid van 0,5 % X verwerpen als X < 9 en X > 21.

Echter volgens het antwoord mag je X pas verwerpen vanaf 23 en volgens deze berekenen vanaf 22. Dit kan ik niet makkelijk verklaren. Of er zit een fout in mijn berekening of er zit een fout in het antwoord.....

gloudie

oke dank voor je antwoord, ik kan hier wel verder mee denk ik.

Heb nog een klein extra vraagje.

Er staan U= 13,07

en U = 27,86

Vervolgens is de sigma geschat en dan staat er 13,07 2,199 en bij 27,86 6,485.

Hoe kun je die sigma dan schatten? De betrouwbaarheid is opnieuw 95%.

sirius

Ik zie even niet zo snel in wat U in deze context zou beteken. Kun je dat wat verder uitleggen?

Wetenschapsforum

Laatste berichten

Nieuwsberichten

statistiek - H0 toetsen

statistiek - H0 toetsen

Re: statistiek - H0 toetsen

Re: statistiek - H0 toetsen

Re: statistiek - H0 toetsen

Re: statistiek - H0 toetsen

Re: statistiek - H0 toetsen

Re: statistiek - H0 toetsen