Data regressie
-
- Berichten: 220
Data regressie
Beste
Stel je hebt data voor een regressie uit te voeren, vb: Model Y=c+X1+X2.
Is het dan erg als de data van mijn afhankelijke variabele niet normaal verdeeld is? Of is het erg is als de data van verklarende variabelen niet normaal verdeeld is?
Mag je alleen een regressie toepassen als de data normaal verdeeld is? Iemand die me meer uitleg kan geven?
Bedankt
Doei
Stel je hebt data voor een regressie uit te voeren, vb: Model Y=c+X1+X2.
Is het dan erg als de data van mijn afhankelijke variabele niet normaal verdeeld is? Of is het erg is als de data van verklarende variabelen niet normaal verdeeld is?
Mag je alleen een regressie toepassen als de data normaal verdeeld is? Iemand die me meer uitleg kan geven?
Bedankt
Doei
-
- Berichten: 954
Re: Data regressie
Het snelste antwoord is: ja, dat is erg. Het langzame antwoord is: het hangt er maar net vanaf.
Kijk voor meer informatie, hier:
four assumptions of regression analysis
Overigens weet ik niet hoe je variabelen er uit zien. Maar, mocht je afhankelijke variabele een categorische variabele zijn, kun je logistische regressie overwegen. Als (een van) de onafhankelijke variabele(n) categorisch zijn, dan kun je die als dummy opnemen in het model.
Kortom, iets meer informatie is vereist voor een goed antwoord.
Kijk voor meer informatie, hier:
four assumptions of regression analysis
Overigens weet ik niet hoe je variabelen er uit zien. Maar, mocht je afhankelijke variabele een categorische variabele zijn, kun je logistische regressie overwegen. Als (een van) de onafhankelijke variabele(n) categorisch zijn, dan kun je die als dummy opnemen in het model.
Kortom, iets meer informatie is vereist voor een goed antwoord.
-
- Berichten: 220
Re: Data regressie
model is zonder categorische variabelen.
Stel loon = X1 + leeftijdX2 + urengewerktX3 + E met loon en urengewerkt niet normaal verdeeld
Hier log toepassen?
Ook geen regressie zelfs als ze niet veel afwijken van normale verdeling?
Dankje
Stel loon = X1 + leeftijdX2 + urengewerktX3 + E met loon en urengewerkt niet normaal verdeeld
Hier log toepassen?
Ook geen regressie zelfs als ze niet veel afwijken van normale verdeling?
Dankje
-
- Berichten: 954
Re: Data regressie
Voor een variabele als inkomen is het gebruikelijk de log te nemen (verdeling wat minder scheef wordt). Verder weet ik niet welke software je gebruikt maar daarin zitten ook allerlei tests opgenomen waarmee je kunt onderzoeken hoe groot het probleem precies is.
-
- Berichten: 220
Re: Data regressie
dus je zegt dat ik log(loon) = X1 + leeftijdX2 + urengewerktX3 + E zou kunnen gebruiken.
Verandert er dan iets bij het verklaren van loon? %ofzo?
Verandert er dan iets bij het verklaren van loon? %ofzo?
-
- Berichten: 220
Re: Data regressie
Als ik van mijn afhankelijke variabele log neem, moet ik dan van andere variabelen ook log nemen?
-
- Berichten: 954
Re: Data regressie
Waarschijnlijk heb je wel iets aan de informatie op deze site