Statistiek ( basis ) vraagstuk

Moderators: ArcherBarry, Fuzzwood

Reageer
Berichten: 62

Statistiek ( basis ) vraagstuk

Voor een tentamen statistiek ( basis ) ben ik een beetje aan het oefenen. Nou heb ik een voorbeeld tentamen gevonden alleen missen hier de antwoorden voor. Nou zijn enkele vragen 'op zich' wel te doen, alleen kom ik uit het volgende vraagstuk geheel niet, hopende dat iemand mij hier mee zou kunnen helpen en aangeven hoe de antwoorden te berekenen zijn:

VRAAG 1:

Men wil nagaan of er in een bepaalde bedrijfstak verschillen bestaan in beloning tussen mannen en vrouwen, die niet kunnen worden verklaard door verschillen in werkervaring, opleidings¬niveau of leeftijd. Bij een aselecte steekproef (N = 100) van werknemers in de bedrijfstak wor¬den inkomen, opleidingsniveau, leeftijd en sekse van de werknemer gemeten. Op deze gegevens wordt een regressieanalyse uitgevoerd, hetgeen de volgende resultaten oplevert. (N.B. Een deel van de SPSS-uitvoer is weggelaten.)

Dependent Variable.. Y (Inkomen)

Variable(s) Entered on Step Number

1.. X1 Opleiding (aantal jaren opleiding)

2.. X2 Leeftijd

3.. X3 Geslacht werknemer (0 = man, 1 = vrouw)

Multiple R .790

------------------ Variables in the Equation ------------------

Variable B SE B Beta T Sig T

X1 161.10 118.340 .06732 1.361 .1768

X2 -4.63 5.621 -.01254 -0.823 .4126

X3 -38.52 11.486 -.21097 -3.353 .0011

(Constant) 774.02 25.365 30.515 .0000

A. Leg in een heldere volzin uit wat wordt bedoeld met de constante waarde van 774.02 in de kolom B.

? - De schatting van x1, x2 en x3 samen wanneer alle 3 een waarde 0 zijn.

B. Geef op basis van de bovenstaande informatie aan hoe het inkomen kan worden geschat van een 32-jarige vrouw met 10 jaar opleiding.

?

C. De waarde van de beta van X3 is –.21097. Waarin verschilt deze waarde van de correlatiecoëfficiënt tussen Y en X3?

?

D. Hoeveel procent van de verschillen in inkomen wordt door de variabelen X1, X2 en X3 verklaard?

79%, dit is te zien aan de Multiple R

E. Geef aan wat de bovenstaande tabel betekent voor het antwoord op de vraag of er sekse-verschillen bestaan in beloning die niet kunnen worden verklaard door verschillen in opleidings¬niveau of leeftijd.

Uit deze tabel blijkt dat alleen geslacht van invloed is op de verschillen die bestaan in beloning. Het blijkt namelijk dat x3 een significantie niveau heeft van .0011, hetgeen dat kleiner is dan .05. Voor x2 ( leeftijd ) en x1 ( opleiding ) blijkt er geen significant verschil te bestaan en verklaard dan ook niet het verschil in beloning.

En tenslotte vraag 2

Men onderzoekt de relatie tussen het welvaartsniveau in landen en de kindersterfte. De kindersterfte wordt gemeten als het aantal sterfgevallen onder kinderen jonger dan 5 jaar per 1000 kinderen (variabele Infmr). Voor het welvaartsniveau worden 5 categorieën onderscheiden, al naar gelang het bruto nationaal product per hoofd van de bevolking (variabele BNP5):

1 = minder dan $300

2 = $300 – $800

3 = $800 – $1500

4 = $1500 – $10000

5 = meer dan $10000

Er wordt een variantieanalyse uitgevoerd met Infmr als afhankelijke variabele en BNP5 als onafhankelijke variabele. Een deel van de gegevens staat in de onderstaande tabel.



A. Neem de ANOVA-tabel over met daarin ingevuld de zes getallen die op de plaats van de *¬-en horen te staan. Berekenen is niet nodig: het geven van een berekeningsformule volstaat.

?

B. Hoe luiden de nulhypothese H0 en de alternatieve hypothese H1 voor deze ANOVA?

H0: er bestaat geen relatie tussen het aantal kindersterfte en het BNP.

H1: de hoogte van het BNP is van invloed op het aantal kindersterfte.

C. Welke conclusie kan worden geformuleerd (in termen van de probleemstelling) op basis van de resultaten van de ANOVA?

Het blijkt dat de H0 dient te worden verworpen en de H1 dient te worden aangenomen. Er blijkt namelijk een significant verschil te bestaan tussen het aantal kindersterfte en het BPN. Het siginificantie niveau is namelijk kleiner dan .05 ( p < 0.05 )

D. Soms wordt als vervolg een Bonferroni multiple comparison test uitgevoerd. Wat is het doel van een dergelijke toets?

Een toetsing bij variantieanalyse, na de algemene vaststelling van significante verschillen, om te weten te komen waar precies de verschillen liggen. Het maakt als het ware verschillende vergelijking met de steekproeven om verschillen te achterhalen.

E. Is het in dit geval zinvol om zo’n toets uit te voeren? Licht uw antwoord toe.

Nee, als je het voor een afhankelijke en een onafhankelijke toets gebruikt, dan raak je het voordeel van de afhankelijke waarnemingen kwijt. Het gevolg is dan dat de kans op een significant resultaat kleiner is dan bij een optimale toets.

Bij enkele vragen heb ik de antwoorden al ingevuld, maar weet niet of deze goed zijn.

Alvast bedankt,

Gebruikersavatar
Berichten: 165

Re: Statistiek ( basis ) vraagstuk

Vraag 1B lijkt me voor de hand liggend; x1= 10 x2=32 en x3=1

De rest is blijkbaar te lang geleden voor mij, maar bij 1c kan ik je wel zeggen dat de b een schatting is van de werkelijke beta, en dat die ook normaal verdeeld is. Je kunt die testen met een T-test en dan kun je zien of h0= de variable is niet relevant of h1= de variable is relevant.
"Your American beer is a little like making love on a canoe."

"How so?"

"It's ******* close to water!"

Berichten: 954

Re: Statistiek ( basis ) vraagstuk

A. Leg in een heldere volzin uit wat wordt bedoeld met de constante waarde van 774.02 in de kolom B.

? - De schatting van x1, x2 en x3 samen wanneer alle 3 een waarde 0 zijn.

Als alle variabelen de waarde 0 hebben, is 774.02 de waarde waar de regressielijn de x-as snijdt

B. Geef op basis van de bovenstaande informatie aan hoe het inkomen kan worden geschat van een 32-jarige vrouw met 10 jaar opleiding.

?

De regressievergelijking is Y = 774.02 + 0.06732*X1 - 0.01254*X2 - 0.21097*X3. Dit kun je invullen en krijg je Y = 774.02 + 0.06732* 10 - 0.01254* 32 - 0.21097* 1

C. De waarde van de beta van X3 is –.21097. Waarin verschilt deze waarde van de correlatiecoëfficiënt tussen Y en X3?

?

Deze verschilt van de correlatie dat ook rekening is gehouden met andere beinvloedende variabelen, dat is bij een correlatie niet het geval

D. Hoeveel procent van de verschillen in inkomen wordt door de variabelen X1, X2 en X3 verklaard?

79%, dit is te zien aan de Multiple R

Ja

E. Geef aan wat de bovenstaande tabel betekent voor het antwoord op de vraag of er sekse-verschillen bestaan in beloning die niet kunnen worden verklaard door verschillen in opleidings¬niveau of leeftijd.

Uit deze tabel blijkt dat alleen geslacht van invloed is op de verschillen die bestaan in beloning. Het blijkt namelijk dat x3 een significantie niveau heeft van .0011, hetgeen dat kleiner is dan .05. Voor x2 ( leeftijd ) en x1 ( opleiding ) blijkt er geen significant verschil te bestaan en verklaard dan ook niet het verschil in beloning.

Inderdaad, als de verschillen tussen mannen en vrouwen verklaard konden worden door leeftijd en opleiding, zou het effect van geslacht niet significant zijn

En tenslotte vraag 2

Men onderzoekt de relatie tussen het welvaartsniveau in landen en de kindersterfte. De kindersterfte wordt gemeten als het aantal sterfgevallen onder kinderen jonger dan 5 jaar per 1000 kinderen (variabele Infmr). Voor het welvaartsniveau worden 5 categorieën onderscheiden, al naar gelang het bruto nationaal product per hoofd van de bevolking (variabele BNP5):

1 = minder dan $300

2 = $300 – $800

3 = $800 – $1500

4 = $1500 – $10000

5 = meer dan $10000

Er wordt een variantieanalyse uitgevoerd met Infmr als afhankelijke variabele en BNP5 als onafhankelijke variabele. Een deel van de gegevens staat in de onderstaande tabel.

A. Neem de ANOVA-tabel over met daarin ingevuld de zes getallen die op de plaats van de *¬-en horen te staan. Berekenen is niet nodig: het geven van een berekeningsformule volstaat.

?

Wat is de formule?

B. Hoe luiden de nulhypothese H0 en de alternatieve hypothese H1 voor deze ANOVA?

H0: er bestaat geen relatie tussen het aantal kindersterfte en het BNP.

H1: de hoogte van het BNP is van invloed op het aantal kindersterfte.

Tip: schrijf twee keer dezelfde hypothese maar met hypothese 0 geen relatie en hypothese 2 wel een relatie. Dat is duidelijker

Berichten: 62

Re: Statistiek ( basis ) vraagstuk

Wederom bedankt voor de snelle antwoorden.

Ik zie dat bij vraag 2 de tabel niet is meegepost, echter denk ik dat ik er zo wel uit zal komen.

Nogmaal bedankt,

Reageer