Springen naar inhoud

Logistische regressie: extreme odds ratio


  • Log in om te kunnen reageren

#1

MilijanaZ

    MilijanaZ


  • 0 - 25 berichten
  • 4 berichten
  • Gebruiker

Geplaatst op 17 mei 2014 - 16:57

Hallo iedereen, 

 

Ik zit vast met het probleem dat de odds ratio in mijn logistische regressie extreme waarden aanneemt. In deze regressie is de afhankelijke variabele de dummy gender (waarbij event= vrouw en non-event= man) en de onafhankelijke variabelen zijn 3 kwantitatieve en één dummy, 'StockID' waarbij Scandinavië = 1 en Zuid-Europa= 0. Nu in Zuid-Europa komt er geen enkele vrouw (event in de afhankelijke) voor. Dus in de crosstabs verschijnt een 0. Dit zou de reden zijn voor de extreem hoge odds ratio bij deze variabele 'StockID'. 

 

Heeft iemand enig idee hoe ik dit probleem kan verhelpen? 

 

Alvast bedankt! 

 

 


Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

Saffron

    Saffron


  • >250 berichten
  • 457 berichten
  • Minicursusauteur

Geplaatst op 17 mei 2014 - 20:49

Ja. Er zijn denk ik twee mogelijkheden: sample representatiever en groter maken door vrouwen uit Zuid-Europa te includeren, of als dat niet mogelijk is, het idee om het effect van StockID te evalueren, laten varen want dat kan je in deze data niet onderzoeken.

#3

MilijanaZ

    MilijanaZ


  • 0 - 25 berichten
  • 4 berichten
  • Gebruiker

Geplaatst op 17 mei 2014 - 20:51

Het probleem is dat er geen vrouwen zijn in dit onderzoek in Zuid-Europa. Is er een andere manier om aan te tonen dat er veel minder vrouwen zijn in Zuid-Europa dan in Scandinavië? Een chi-square?
Bedankt!

#4

Saffron

    Saffron


  • >250 berichten
  • 457 berichten
  • Minicursusauteur

Geplaatst op 17 mei 2014 - 21:04

Ik weet niet wat de precieze vraagstelling is, maar als je iets wil zeggen over het verschil in het aantal vrouwen tussen twee gebieden, dan moeten de steekproeven wel representatief zijn voor die gebieden. Als dat niet het geval is, dan kun je wel allemaal statistiek op de data loslaten, maar dat is in dat geval zinloos omdat er eerder in het onderzoeksproces al iets grondig verkeerd zit.

#5

MilijanaZ

    MilijanaZ


  • 0 - 25 berichten
  • 4 berichten
  • Gebruiker

Geplaatst op 18 mei 2014 - 07:55

Ja dat begrijp ik! Maar het probleem is dat als ik nu andere gebieden bij Zuid-Europa steek, en dus meer vrouwen heb in de steekproef, de odds ratio voor een andere variabele (ROA) extreem wordt. Ik heb dan het interactie-effect tussen ROA en de dummy StockID erbij gestoken en blijkt dat deze significant is met een odds ratio van 10,737. De ROA zelf is dan wel geen significante variabele meer. Hoe interpreteer ik dit? Is het dan de oplossing om ROA uit deze analyse te laten? Voor de rest heb ik met geen enkele analyse dit probleem gehad... 


#6

Saffron

    Saffron


  • >250 berichten
  • 457 berichten
  • Minicursusauteur

Geplaatst op 22 mei 2014 - 21:11

Als je interactie significant is dan is de associatie tussen ROA en je Y verschillend voor verschillende waarden van stockID. In dat geval kan je een gestratificeerde analyse doen.





0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures