Springen naar inhoud

Binomiale logistische regressie



  • Log in om te kunnen reageren

#1

TomDeS

    TomDeS


  • 0 - 25 berichten
  • 13 berichten
  • Gebruiker

Geplaatst op 28 december 2013 - 13:35

Goedemorgen/middag/avond

Geen idee of er iemand is op dit forum met de nodige achtergrond voor deze vraag, maar ik denk het wel.

Voor een examenopdracht moet ik in SPSS onder andere een (binomiale) logistische regressie opstellen. De opgave (exclusief datasets) staat in bijlage.
Nu hebben we onder het jaar vast alles gezien wat we nodig hebben om dit op te lossen, maar niet in deze vraagvorm. Dus hoop ik dat er iemand de opdracht kan verduidelijken (prof zelf beantwoordt geen vragen omtrent deze opdracht).

Vraag 1a:

Kies (of construeer) uit de databank een variabele die je wenst verklaren aan de hand van een logistisch regressiemodel. Neem minstens 3 tot maximaal 10 zinvolle verklarende variabelen op. Zorg er voor dat je, naast de basisresultaten van je geschatte model, met de output minstens in staat bent om de volgende aspecten te bekijken en te beoordelen (in alfabetische volgorde):

  • Fit tussen de waargenomen en de voorspelde kansen over de volledige range van voorspelde kansen;
  • Kwaliteit van het model;
  • Mogelijkheid van het geschatte model om de waargenomen groepen ook effectief te voorspellen;
  • Quasi-multicollineariteit;
  • Quasi-volledige separatie;


Wat heb ik gedaan:
  • Een variabele geselecteerd om te verklaren (hoe gelukkig mensen zijn, was een vraag op een schaal van 1-5 met 1 very happy.)
    Het antwoord op deze vraag was sterk rechts-scheef verdeeld, dus heb ik die gehercodeerd naar een dummy.
  • Acht verklarende variabelen geselecteerd (gender, age, education, main activity, mariage, children living in household, member of religious denomination en how interested in politics).
  • In SPSS: analyze>regression>Binary Logistics uitgevoerd volgens de enter methode
Dat geeft allemaal een output.

Kan iemand mij vertellen:
  • Wat van deze output behoort tot de 'basisresultaten van het geschatte model'?
  • 'Fit tussen de waargenomen en de voorspelde kansen over de volledige range van de voorspelde kansen'
    => Is dit met de Hosmer en Lemeshow test?
  • Kwaliteit van het model
    => Is dit de classification table samen met Observed Groups and Predicted Probabilities grafiek?
Als je dit kan verduidelijken voor mij dank u wel, en anders ook. Alleszins alvast een gelukkig nieuwjaar.

Bijgevoegde Bestanden


Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

Saffron

    Saffron


  • >250 berichten
  • 457 berichten
  • Minicursusauteur

Geplaatst op 28 december 2013 - 17:08

Nu hebben we onder het jaar vast alles gezien wat we nodig hebben om dit op te lossen, maar niet in deze vraagvorm.

Ja, dat is om te kijken of je de stof niet alleen begrepen hebt, maar ook zelfstandig kunt toepassen op een nieuwe situatie. Ik heb best de kennis in huis om dit op te lossen, maar het lijkt me niet de bedoeling om jouw je examen-opgaven te gaan zitten voorkauwen. Wat je hier nu vraagt is namelijk precies datgene waarvan de prof wil weten of je het beheerst. Ik zou als ik jou was nog eens goed alle leerstof doornemen en kijken welke delen daarvan van toepassing zijn op deze opgave.

#3

TomDeS

    TomDeS


  • 0 - 25 berichten
  • 13 berichten
  • Gebruiker

Geplaatst op 28 december 2013 - 17:40

Ja, dat is om te kijken of je de stof niet alleen begrepen hebt, maar ook zelfstandig kunt toepassen op een nieuwe situatie. Ik heb best de kennis in huis om dit op te lossen, maar het lijkt me niet de bedoeling om jouw je examen-opgaven te gaan zitten voorkauwen. Wat je hier nu vraagt is namelijk precies datgene waarvan de prof wil weten of je het beheerst. Ik zou als ik jou was nog eens goed alle leerstof doornemen en kijken welke delen daarvan van toepassing zijn op deze opgave.


Dag Saffron

Leuk om te weten dat jij mij dan kan helpen. Uiteraard is het niet de bedoeling dat iemand anders mijn opdracht maakt. Van daar ook dat ik de database er niet heb bijgestoken. En je hebt zeker gelijk, ik heb moeite met het verwerken van de theorie naar de praktijk. Het zou dus wel zo leuk zijn moest, gezien het belang van deze opdracht, iemand mij enige feedback kan geven zodat ik weet of ik juist bezig ben of niet.

Ik heb deze output met betrekking tot de eerste vraag opgenomen:

Kwaliteit van het model:
  • Nagaan van de verklaringskracht op basis van Iteration History. Hieruit blijkt dat Likelihood met enkel de constante 630,940 is.
  • Uit de Model Summary tabel blijkt dat de likelihood van het volledige model 593,936 is.
  • Omnibus Tests of Model Coefficients: H0 (model is niet zinvol, alle parameters gelijk aan nul) wordt verworpen.

Voorwaarden:
Goodness-of-fit (n is groter dan 400):
  • Hosmer and Lemeshow Test: H0 (data zijn afkomstig van gefitte model), Sig = 0,831 dus H0 wordt niet verworpen (goed model).
  • Contingency Table for Hosmer and Lemeshow Test bevestigt voorgaande
QMC:
  • Coefficients: Collinearity Statistics Tolerance zijn overal groter dan 0,64, géén QMC dus.
Outliers:
  • Worden weergegeven in Casewise List
QVS:
  • Model Summary SPSS stopt na 7 stappen, positief.
Voorspellingen:
Classificatietabel:
  • Classification table: Specificiteit=100%; Sensitiviteit=1,7%; Algemeen: 94,6%
ROC-Curve & C-score:
  • ROC-curve: ziet er goed uit
  • C-score (Area under the curve: Sig <0,05 dus het model is beter dan gokken (gokken: C=0,5)
Toets voor 2 parameters de hypothese dat beide parameters nul zijn:
  • Omnibus Tests of Model Coefficients opgesteld voor 2 parameters.
    H0: age & gender = 0 wordt verworpen (sig. 0,007).


Ik begrijp dat het moeilijk is om zo iets te zeggen over mijn output. Wil je toch proberen feedback te geven?


Dank je wel






Also tagged with one or more of these keywords: wiskunde

0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures