Springen naar inhoud

Statistiek


  • Log in om te kunnen reageren

#1

lottieke

    lottieke


  • 0 - 25 berichten
  • 17 berichten
  • Gebruiker

Geplaatst op 02 november 2010 - 08:48

Beste,

We moeten een regressie analyse maken om na te gaan wat de determinanten zijn op de gezondheidsuitgaven in BelgiŽ.
Hier voor gebruiken we als regressievergelijking
gezondheidsuitgaven = constante + constane * eldery + constante * doctors + constante * alcohol + constante * politieke overweging (opgenomen via een dummy variabele)

Nu is mijn probleem dat er een extra variabele opgegeven wordt (education) en deze heeft een invloed op doctors, want hoe groter het aantal inschrijvingen (education), hoe groter het aantal afgestudeerden (doctors).

Nu vraag ik mij af hoe je dit kan opnemen in het regressiemodel.
Ik had al gedacht aan een regressie uitvoeren van afgestudeerden op doctors, maar dit lijkt mij niet echt het juiste antwoord.
Ook had ik gedacht om het probleem op te lossen via multicollineariteit (er is immers een bepaalde graad van correlatie tussen doctors en de verklarende variabele education).

Als mulitcollineariteit, mijn juiste werkwijze is, weet iemand dan hoe je dit moet doen in eviews?

Alvast bedankt

Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

ferry

    ferry


  • >250 berichten
  • 954 berichten
  • VIP

Geplaatst op 02 november 2010 - 09:53

Dag Lottieke,

Wat bedoel je precies met "het probleem op te lossen via multicollineariteit"? Multicollineariteit is op zichzelf een probleem, maar lost verder niets op.


Wat je kunt doen is eerst bekijken in hoeverre multicollineariteit een probleem is. Dat kun je bijvoorbeeld doen door de VIF te berekenen.
http://www.researchc...nostics-vif.asp

Vergelijk ook modellen waarbij de ene variabele is opgenomen, waarbij de andere variabele is opgenomen en waarbij zij allebei zijn opgenomen. Wat gebeurt er met de parameters? En, vooral ook: wat gebeurt er met de verklaarde variantie (en dan met name het verschil tussen de gewone en de "adjusted")?

Een manier waarmee multicollineariteit kan worden tegengegaan is het centreren van de variabelen. Als er dus een probleem blijkt te zijn, centreer dan de variabelen en kijk wat er gebeurt met de resultaten.

Succes
Ferry

Veranderd door ferry, 02 november 2010 - 09:53


#3

lottieke

    lottieke


  • 0 - 25 berichten
  • 17 berichten
  • Gebruiker

Geplaatst op 02 november 2010 - 10:06

Beste,

Ik bedoelde eigenlijk dat deze variabele enkel multicollineariteit met zich meebrengt, en dus niet echt in het model van de volledige regressievergelijking moet opgenomen worden.

Mijn vraag is eigenlijk vooral, hoe moet je deze variabele opnemen in het regressiemodel, aangezien het eigenlijk een derde verklarende variabele is, die een variabele van het regressiemodel beinvloedt, maar zelf niet opgenomen wordt in het regressiemodel.

Mijn vraag is dus, hoe moet je de invloed van education op doctors nagaan zonder education op te nemen als bijkomende verklarende variabele in het regressiemodel.

Alvast bedankt

#4

ferry

    ferry


  • >250 berichten
  • 954 berichten
  • VIP

Geplaatst op 02 november 2010 - 10:53

Mijn vraag is dus, hoe moet je de invloed van education op doctors nagaan zonder education op te nemen als bijkomende verklarende variabele in het regressiemodel.


Als je het zo formuleert is "doctors" de afhankelijke variabele en "education" de onafhankelijke. Dat kun je gewoon in een regressie doen, zonder dat er een probleem optreedt.

Maar, dat heeft dan niks meer te maken met het eerdere model (gezondheidsuitgaven = constante + constane * eldery + constante * doctors + constante * alcohol + constante * politieke overweging (opgenomen via een dummy variabele))

#5

lottieke

    lottieke


  • 0 - 25 berichten
  • 17 berichten
  • Gebruiker

Geplaatst op 02 november 2010 - 11:26

Ik besef dat dit een nieuw regressiemodel kan zijn, maar begrijp niet hoe je dan de eerdere regressie in de nieuwe regressie moet vatten.

Concreet de opgave:
doctors = het aantal afgestudeerden aan een medische richting die in BelgiŽ in een medische branche werken. Deze variabele is uitgedrukt per 1000 inwoners.

daarnaast hebben we 1 extra variabele education:
dit is het aantal inschrijvingen van studenten in een post-secundaire richting als percentage van de totale bevolking. Een toename van deze variabele leidt tot een stijging van het aantal afgestudeerden in een medische richting en heeft aldus een positief effect op de variabele doctors.

We veronderstellen ook de hoogte van de gezondheidsuitgaven geen invloed heeft op education

Merk verder dat meer gezondheidsuitgaven opportuniteiten meebrengt voor toekomstig afgestudeerden in een medische richting, waardoor dit kan leiden tot meer tewerkstelling voor deze personen in een medische branche in BelgiŽ

Alvast bedankt

#6

ferry

    ferry


  • >250 berichten
  • 954 berichten
  • VIP

Geplaatst op 02 november 2010 - 11:49

Ik besef dat dit een nieuw regressiemodel kan zijn, maar begrijp niet hoe je dan de eerdere regressie in de nieuwe regressie moet vatten.


Nou, dat zou wellicht met een 2 stage least squares regressie kunnen, maar ik weet niet of dat binnen de opdracht valt. Anders heb je 2 uitkomsten, namelijk 1 waarin het aantal artsen wordt voorspeld en 1 waarin gezondheidsuitgaven worden voorspeld.

#7

lottieke

    lottieke


  • 0 - 25 berichten
  • 17 berichten
  • Gebruiker

Geplaatst op 02 november 2010 - 11:58

Tot nu toe hebben we deze leerstof over 2 stage least squares nog niet gezien. Ik wacht af wat de lessen nog brengen ;).

Alvast bedankt voor het snelle antwoord





0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures