Springen naar inhoud

Data regressie


  • Log in om te kunnen reageren

#1

phenomen

    phenomen


  • >100 berichten
  • 220 berichten
  • Ervaren gebruiker

Geplaatst op 02 april 2008 - 17:23

Beste

Stel je hebt data voor een regressie uit te voeren, vb: Model Y=c+X1+X2.
Is het dan erg als de data van mijn afhankelijke variabele niet normaal verdeeld is? Of is het erg is als de data van verklarende variabelen niet normaal verdeeld is?
Mag je alleen een regressie toepassen als de data normaal verdeeld is? Iemand die me meer uitleg kan geven?

Bedankt
Doei

Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

ferry

    ferry


  • >250 berichten
  • 954 berichten
  • VIP

Geplaatst op 02 april 2008 - 18:04

Het snelste antwoord is: ja, dat is erg. Het langzame antwoord is: het hangt er maar net vanaf.

Kijk voor meer informatie, hier:
four assumptions of regression analysis

Overigens weet ik niet hoe je variabelen er uit zien. Maar, mocht je afhankelijke variabele een categorische variabele zijn, kun je logistische regressie overwegen. Als (een van) de onafhankelijke variabele(n) categorisch zijn, dan kun je die als dummy opnemen in het model.

Kortom, iets meer informatie is vereist voor een goed antwoord.

#3

dirkwb

    dirkwb


  • >1k berichten
  • 4172 berichten
  • Moderator

Geplaatst op 02 april 2008 - 18:15

regres.jpg
Quitters never win and winners never quit.

#4

phenomen

    phenomen


  • >100 berichten
  • 220 berichten
  • Ervaren gebruiker

Geplaatst op 02 april 2008 - 18:34

model is zonder categorische variabelen.
Stel loon = X1 + leeftijdX2 + urengewerktX3 + E met loon en urengewerkt niet normaal verdeeld

Hier log toepassen?
Ook geen regressie zelfs als ze niet veel afwijken van normale verdeling?

Dankje

#5

ferry

    ferry


  • >250 berichten
  • 954 berichten
  • VIP

Geplaatst op 02 april 2008 - 21:18

Voor een variabele als inkomen is het gebruikelijk de log te nemen (verdeling wat minder scheef wordt). Verder weet ik niet welke software je gebruikt maar daarin zitten ook allerlei tests opgenomen waarmee je kunt onderzoeken hoe groot het probleem precies is.

#6

phenomen

    phenomen


  • >100 berichten
  • 220 berichten
  • Ervaren gebruiker

Geplaatst op 03 april 2008 - 10:14

dus je zegt dat ik log(loon) = X1 + leeftijdX2 + urengewerktX3 + E zou kunnen gebruiken.

Verandert er dan iets bij het verklaren van loon? %ofzo?

#7

phenomen

    phenomen


  • >100 berichten
  • 220 berichten
  • Ervaren gebruiker

Geplaatst op 06 april 2008 - 14:02

Als ik van mijn afhankelijke variabele log neem, moet ik dan van andere variabelen ook log nemen?

#8

ferry

    ferry


  • >250 berichten
  • 954 berichten
  • VIP

Geplaatst op 06 april 2008 - 14:05

Waarschijnlijk heb je wel iets aan de informatie op deze site





0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures