Springen naar inhoud

Regressie: afhankelijke variabele is count var.


  • Log in om te kunnen reageren

#1

Daan2008

    Daan2008


  • 0 - 25 berichten
  • 4 berichten
  • Gebruiker

Geplaatst op 04 november 2008 - 22:49

Beste forumleden,

Na 3 uur lang dit forum doorgespit te hebben, lukt het me toch niet een antwoord te vinden op mijn specifieke vraag.
Voor mijn afstudeerscriptie ben ik namelijk bezig met een aantal analyses in SPSS:

Ik heb een afhankelijke variabele (count variabele) en 4 onafhankelijke variabelen (n=27)

Op het moment dat ik een lineaire regressieanalyse uitvoer dan blijkt dat alle testen niet significant verklarend zijn (het getal in de coefficiententabel onder Sig is te hoog). Deze vier onafhankelijke variabelen blijken zťťr sterk gecorreleerd te zijn aan elkaar. Nu wil ik echt graag deze vier onafhankelijke variabelen gebruiken, maar zonder dat deze waarden zo hoog worden.

Iemand vertelde mij nu dat het probleem wellicht zit in de afhankelijke variabele, deze is niet-lineair (dus kwadratisch). Dit heb ik inderdaad gechecked en de lineariteit blijkt inderdaad ver te zoeken te zijn. Nu heb ik net een heel topic zitten lezen over het aanpassen van variabelen (het centreren van nieuwe variabelen) alleen rest de vraag, wat zijn de handelingen om vervolgens middels SPSS een goede regressieanalyse eruit te krijgen?

Of moet ik een andere soort regressieanalyse uitvoeren omdat de afhankelijke variabele niet lineair is?

Kan iemand mij helpen?
Ik ben al lang bezig met zoeken, maar zie even door de bomen het bos niet meer...
Alle suggesties zijn welkom!

Alvast bedankt!

Bijlage  output_regression__04_11_2008_2.doc   46,5K   109 maal gedownload

Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

ferry

    ferry


  • >250 berichten
  • 954 berichten
  • VIP

Geplaatst op 04 november 2008 - 23:26

Hoi Daan,

Mooi dat je de output hebt toegevoegd, dat maakt het commentaar een stuk gemakkelijker.

Wat ontbreekt en wat wel handig zou zijn, is een idee te hebben van de verdeling van de afhankelijke variabele. Volgt die min of meer een normale verdeling? Zo niet, dan kun je overwegen een transformatie toe te passen, maar welke is afhankelijk van de verdeling die de variabele heeft.

Wat een ander mogelijk probleem met je analyses kan zijn is het lage aantal waarnemingen. Met 27 cases zou je net wat correlaties kunnen doen, maar een regressie met 4 onafhankelijke variabelen is al een beetje veel gevraagd.

Dat de onafhankelijke variabelen sterk onderling gecorreleerd zijn, kun je overigens al aflezen aan de verklaarde variantie. Er is een vrij groot verschil tussen de gewone r-kwadraat en de "adjusted". Als extra test kun je in SPSS aangeven dat je de VIF waardes wilt hebben, die geven aan in hoeverre sprake is van een sterke samenhang tussen de onafhankelijke variabelen. Is dat inderdaad een probleem, dan kun je de onafhankelijke variabelen centreren. Waarschijnlijk is dat probleem dan opgelost.

Succes
Ferry

#3

Daan2008

    Daan2008


  • 0 - 25 berichten
  • 4 berichten
  • Gebruiker

Geplaatst op 05 november 2008 - 09:31

Hoi Ferry,

Bedankt voor je antwoord. Ik heb een normale verdelingstest gedaan, en hij blijkt inderdaad niet normaal verdeeld te zijn (zie bijlage).

Ik denk dat regressie inderdaad niet handig is voor deze sample. Wat weet jij van Poisson of Negative binominal testen? Veel literatuuronderzoeken die ook over patenten gaan (die van mij dus ook), gebruiken die vaak. Ik ben hier zelf niet zo bekend mee. Mijn SSPS boek(en) hebben hier ook weinig over te melden.

Bedankt!

Daan


Bijlage  output_normaleverdeling.doc   42K   81 maal gedownload

#4

ferry

    ferry


  • >250 berichten
  • 954 berichten
  • VIP

Geplaatst op 05 november 2008 - 09:40

Hoi Daan,

Nou voor bijvoorbeeld een Poisson regressie, zal de afhankelijke variabele een poisson-verdeling moeten volgen. Het gaat meer om de verdeling van de afhankelijke variabele dan het al dan niet kunnen gebruiken van regressie.

Gezien de verdeling van de afhankelijke variabele zou ik overwegen de log ervan te nemen. Is dat iets dat je veel tegenkomt in patentonderzoek?

Ferry

#5

Daan2008

    Daan2008


  • 0 - 25 berichten
  • 4 berichten
  • Gebruiker

Geplaatst op 05 november 2008 - 10:46

Hoi Ferry,

Ja dat klopt. Het gebruiken van een log van Y gebeurt. Echter heb ik geen idee van wat dat inhoudt en hoe dat moet. Ook weet ik nog niet bepaald hoe ik een Poisson regressie moet uitvoeren in SPSS.

Tips?

Bedankt alweer!

#6

ferry

    ferry


  • >250 berichten
  • 954 berichten
  • VIP

Geplaatst op 05 november 2008 - 13:45

Hoi Daan,

De log van de variabele kun je aanmaken door een nieuwe variabele aan te maken, te weten met de volgende syntax:

compute log_patenten = ln (patenten).
exe


Een poissionregressie zal je in dit geval overigens niet verder helpen.

Ferry

#7

Daan2008

    Daan2008


  • 0 - 25 berichten
  • 4 berichten
  • Gebruiker

Geplaatst op 06 november 2008 - 15:51

Hoi Ferry,

Bedankt voor je hulp!
Logs worden inderdaad veelvuldig gebruikt, dus dat heb ik dan ook maar gedaan :D

Voorlopig lijkt hiermee alles goed te gaan.

Nogmaals, dank voor je hulp, dat maakt dit formum echt nuttig (iig voor mij).

Groeten,
Daan





0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures