Logistische regressie: extreme odds ratio

Moderators: dirkwb, Xilvo

Reageer
Berichten: 4

Logistische regressie: extreme odds ratio

Hallo iedereen, 
 
Ik zit vast met het probleem dat de odds ratio in mijn logistische regressie extreme waarden aanneemt. In deze regressie is de afhankelijke variabele de dummy gender (waarbij event= vrouw en non-event= man) en de onafhankelijke variabelen zijn 3 kwantitatieve en één dummy, 'StockID' waarbij Scandinavië = 1 en Zuid-Europa= 0. Nu in Zuid-Europa komt er geen enkele vrouw (event in de afhankelijke) voor. Dus in de crosstabs verschijnt een 0. Dit zou de reden zijn voor de extreem hoge odds ratio bij deze variabele 'StockID'. 
 
Heeft iemand enig idee hoe ik dit probleem kan verhelpen? 
 
Alvast bedankt! 
 
 

Gebruikersavatar
Berichten: 467

Re: Logistische regressie: extreme odds ratio

Ja. Er zijn denk ik twee mogelijkheden: sample representatiever en groter maken door vrouwen uit Zuid-Europa te includeren, of als dat niet mogelijk is, het idee om het effect van StockID te evalueren, laten varen want dat kan je in deze data niet onderzoeken.

Berichten: 4

Re: Logistische regressie: extreme odds ratio

Het probleem is dat er geen vrouwen zijn in dit onderzoek in Zuid-Europa. Is er een andere manier om aan te tonen dat er veel minder vrouwen zijn in Zuid-Europa dan in Scandinavië? Een chi-square?

Bedankt!

Gebruikersavatar
Berichten: 467

Re: Logistische regressie: extreme odds ratio

Ik weet niet wat de precieze vraagstelling is, maar als je iets wil zeggen over het verschil in het aantal vrouwen tussen twee gebieden, dan moeten de steekproeven wel representatief zijn voor die gebieden. Als dat niet het geval is, dan kun je wel allemaal statistiek op de data loslaten, maar dat is in dat geval zinloos omdat er eerder in het onderzoeksproces al iets grondig verkeerd zit.

Berichten: 4

Re: Logistische regressie: extreme odds ratio

Ja dat begrijp ik! Maar het probleem is dat als ik nu andere gebieden bij Zuid-Europa steek, en dus meer vrouwen heb in de steekproef, de odds ratio voor een andere variabele (ROA) extreem wordt. Ik heb dan het interactie-effect tussen ROA en de dummy StockID erbij gestoken en blijkt dat deze significant is met een odds ratio van 10,737. De ROA zelf is dan wel geen significante variabele meer. Hoe interpreteer ik dit? Is het dan de oplossing om ROA uit deze analyse te laten? Voor de rest heb ik met geen enkele analyse dit probleem gehad... 

Gebruikersavatar
Berichten: 467

Re: Logistische regressie: extreme odds ratio

Als je interactie significant is dan is de associatie tussen ROA en je Y verschillend voor verschillende waarden van stockID. In dat geval kan je een gestratificeerde analyse doen.

Reageer