Springen naar inhoud

Analyse met categorische variabelen


  • Log in om te kunnen reageren

#1

jones123

    jones123


  • >25 berichten
  • 92 berichten
  • Ervaren gebruiker

Geplaatst op 22 maart 2014 - 16:50

Beste,

Ik werk een voorbeeldproef uit voor statistiek, waarin ik de appreciatie van een landschap moet voorspellen aan de hand van wat er te zien is in het landschap.

Ik heb 4 variabelen:
x1: % bos
x2: % water
x3: Type topografie (1 = vlak, 2 = matig hellend, 3 = sterk hellend)
x4: Type bebouwing (1 = geen, 2 = verspreid, 3 = geconcentreerd)

Ik wil dus eigenlijk een vergelijking bekomen om de landschapsappreciatie te voorspellen: LA = ..x1 + ..x2 + ..x3 + ..x4

Mijn vraag is: welke analyse moet ik hiervoor doen om te weten welke significant zijn?
Moet ik de categorische variabelen apart meenemen in een meervoudige regressie? Bijvoorbeeld een regressie tussen y en x1, x2, x31, x32, x33, x41, x42, x43?

Of hoe moet ik omgaan met die categorische variabelen?

Alvast bedankt!

Veranderd door jones123, 22 maart 2014 - 16:51


Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

Saffron

    Saffron


  • >250 berichten
  • 457 berichten
  • Minicursusauteur

Geplaatst op 22 maart 2014 - 18:44

Welke analyse je moet doen hangt af van het meetniveau van je uitkomst landschapsappreciatie is. Als die continue is, dan kan je regressie of een anova doen. Voor categorische variabelen zul je met dummies moeten werken (als je googelt op 'create dummy variables' dan vind je wel uitleg hoe je dat moet doen). Het aantal dummies is altijd het aantal antwoordcategorieen - 1. Dus in jouw geval heb je voor x3 en x4 elk 2 dummy variabelen.

#3

jones123

    jones123


  • >25 berichten
  • 92 berichten
  • Ervaren gebruiker

Geplaatst op 22 maart 2014 - 20:07

Welke analyse je moet doen hangt af van het meetniveau van je uitkomst landschapsappreciatie is. Als die continue is, dan kan je regressie of een anova doen. Voor categorische variabelen zul je met dummies moeten werken (als je googelt op 'create dummy variables' dan vind je wel uitleg hoe je dat moet doen). Het aantal dummies is altijd het aantal antwoordcategorieen - 1. Dus in jouw geval heb je voor x3 en x4 elk 2 dummy variabelen.


Landschapsappreciatie werd geëvalueerd met een score van 1 tot 7 met 7 als zeer mooi, dat is dan numerisch veronderstel ik?

Ik dacht:
als je een numerische variabele moet voorspellen aan de hand van zowel een categorische en een numerische, is dat dan geen ANCOVA?

Veranderd door jones123, 22 maart 2014 - 20:12


#4

Saffron

    Saffron


  • >250 berichten
  • 457 berichten
  • Minicursusauteur

Geplaatst op 22 maart 2014 - 20:40

Dat wordt inderdaad soms ancova genoemd, al is Ancova strict gezien een model met alleen continue covariaten.
Zo'n 7 punts schaal is ordinaal. Er zijn hele volksstammen die zulke ordinale schalen als continue variabele beschouwen en er een lineaire regressie op los laten (als het normaal verdeeld is), maar veel statistici vinden dat not done en vinden dat je dan een model moet gebruiken dat geschikt is voor ordinale uitkomsten. Een andere optie is dichotomiseren van de uitkomstmaat en daarmee een logistische regressie doen.





0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures