[wiskunde] Binomiale logistische regressie

TomDeS

Goedemorgen/middag/avond

Geen idee of er iemand is op dit forum met de nodige achtergrond voor deze vraag, maar ik denk het wel.

Voor een examenopdracht moet ik in SPSS onder andere een (binomiale) logistische regressie opstellen. De opgave (exclusief datasets) staat in bijlage.

Nu hebben we onder het jaar vast alles gezien wat we nodig hebben om dit op te lossen, maar niet in deze vraagvorm. Dus hoop ik dat er iemand de opdracht kan verduidelijken (prof zelf beantwoordt geen vragen omtrent deze opdracht).

Vraag 1a:

Kies (of construeer) uit de databank een variabele die je wenst verklaren aan de hand van een logistisch regressiemodel. Neem minstens 3 tot maximaal 10 zinvolle verklarende variabelen op. Zorg er voor dat je, naast de basisresultaten van je geschatte model, met de output minstens in staat bent om de volgende aspecten te bekijken en te beoordelen (in alfabetische volgorde):

Fit tussen de waargenomen en de voorspelde kansen over de volledige range van voorspelde kansen;

Kwaliteit van het model;

Mogelijkheid van het geschatte model om de waargenomen groepen ook effectief te voorspellen;

Quasi-multicollineariteit;

Quasi-volledige separatie;

Wat heb ik gedaan:

Een variabele geselecteerd om te verklaren (hoe gelukkig mensen zijn, was een vraag op een schaal van 1-5 met 1 very happy.)

Het antwoord op deze vraag was sterk rechts-scheef verdeeld, dus heb ik die gehercodeerd naar een dummy.
Acht verklarende variabelen geselecteerd (gender, age, education, main activity, mariage, children living in household, member of religious denomination en how interested in politics).
In SPSS: analyze>regression>Binary Logistics uitgevoerd volgens de enter methode

Dat geeft allemaal een output.

Kan iemand mij vertellen:

Wat van deze output behoort tot de 'basisresultaten van het geschatte model'?
'Fit tussen de waargenomen en de voorspelde kansen over de volledige range van de voorspelde kansen'

=> Is dit met de Hosmer en Lemeshow test?
Kwaliteit van het model

=> Is dit de classification table samen met Observed Groups and Predicted Probabilities grafiek?

Als je dit kan verduidelijken voor mij dank u wel, en anders ook. Alleszins alvast een gelukkig nieuwjaar.

Saffron

TomDeS schreef:Nu hebben we onder het jaar vast alles gezien wat we nodig hebben om dit op te lossen, maar niet in deze vraagvorm.

Ja, dat is om te kijken of je de stof niet alleen begrepen hebt, maar ook zelfstandig kunt toepassen op een nieuwe situatie. Ik heb best de kennis in huis om dit op te lossen, maar het lijkt me niet de bedoeling om jouw je examen-opgaven te gaan zitten voorkauwen. Wat je hier nu vraagt is namelijk precies datgene waarvan de prof wil weten of je het beheerst. Ik zou als ik jou was nog eens goed alle leerstof doornemen en kijken welke delen daarvan van toepassing zijn op deze opgave.

TomDeS

Saffron schreef: ↑za 28 dec 2013, 17:08
Ja, dat is om te kijken of je de stof niet alleen begrepen hebt, maar ook zelfstandig kunt toepassen op een nieuwe situatie. Ik heb best de kennis in huis om dit op te lossen, maar het lijkt me niet de bedoeling om jouw je examen-opgaven te gaan zitten voorkauwen. Wat je hier nu vraagt is namelijk precies datgene waarvan de prof wil weten of je het beheerst. Ik zou als ik jou was nog eens goed alle leerstof doornemen en kijken welke delen daarvan van toepassing zijn op deze opgave.

Dag Saffron

Leuk om te weten dat jij mij dan kan helpen. Uiteraard is het niet de bedoeling dat iemand anders mijn opdracht maakt. Van daar ook dat ik de database er niet heb bijgestoken. En je hebt zeker gelijk, ik heb moeite met het verwerken van de theorie naar de praktijk. Het zou dus wel zo leuk zijn moest, gezien het belang van deze opdracht, iemand mij enige feedback kan geven zodat ik weet of ik juist bezig ben of niet.

Ik heb deze output met betrekking tot de eerste vraag opgenomen:

Kwaliteit van het model:

Nagaan van de verklaringskracht op basis van Iteration History. Hieruit blijkt dat Likelihood met enkel de constante 630,940 is.
Uit de Model Summary tabel blijkt dat de likelihood van het volledige model 593,936 is.
Omnibus Tests of Model Coefficients: H0 (model is niet zinvol, alle parameters gelijk aan nul) wordt verworpen.

Voorwaarden:

Goodness-of-fit (n is groter dan 400):

Hosmer and Lemeshow Test: H0 (data zijn afkomstig van gefitte model), Sig = 0,831 dus H0 wordt niet verworpen (goed model).
Contingency Table for Hosmer and Lemeshow Test bevestigt voorgaande

QMC:

Coefficients: Collinearity Statistics Tolerance zijn overal groter dan 0,64, géén QMC dus.

Outliers:

Worden weergegeven in Casewise List

QVS:

Model Summary SPSS stopt na 7 stappen, positief.

Voorspellingen:

Classificatietabel:

Classification table: Specificiteit=100%; Sensitiviteit=1,7%; Algemeen: 94,6%

ROC-Curve & C-score:

ROC-curve: ziet er goed uit
C-score (Area under the curve: Sig <0,05 dus het model is beter dan gokken (gokken: C=0,5)

Toets voor 2 parameters de hypothese dat beide parameters nul zijn:

Omnibus Tests of Model Coefficients opgesteld voor 2 parameters.

H0: age & gender = 0 wordt verworpen (sig. 0,007).

Ik begrijp dat het moeilijk is om zo iets te zeggen over mijn output. Wil je toch proberen feedback te geven?

Dank je wel

Wetenschapsforum

Laatste berichten

Nieuwsberichten

[wiskunde] Binomiale logistische regressie

Binomiale logistische regressie

Re: Binomiale logistische regressie

Re: Binomiale logistische regressie