Analyse met categorische variabelen

Moderators: dirkwb, Xilvo

Reageer
Berichten: 92

Analyse met categorische variabelen

Beste,

Ik werk een voorbeeldproef uit voor statistiek, waarin ik de appreciatie van een landschap moet voorspellen aan de hand van wat er te zien is in het landschap.

Ik heb 4 variabelen:

x1: % bos

x2: % water

x3: Type topografie (1 = vlak, 2 = matig hellend, 3 = sterk hellend)

x4: Type bebouwing (1 = geen, 2 = verspreid, 3 = geconcentreerd)

Ik wil dus eigenlijk een vergelijking bekomen om de landschapsappreciatie te voorspellen: LA = ..x1 + ..x2 + ..x3 + ..x4

Mijn vraag is: welke analyse moet ik hiervoor doen om te weten welke significant zijn?

Moet ik de categorische variabelen apart meenemen in een meervoudige regressie? Bijvoorbeeld een regressie tussen y en x1, x2, x31, x32, x33, x41, x42, x43?

Of hoe moet ik omgaan met die categorische variabelen?

Alvast bedankt!

Gebruikersavatar
Berichten: 467

Re: Analyse met categorische variabelen

Welke analyse je moet doen hangt af van het meetniveau van je uitkomst landschapsappreciatie is. Als die continue is, dan kan je regressie of een anova doen. Voor categorische variabelen zul je met dummies moeten werken (als je googelt op 'create dummy variables' dan vind je wel uitleg hoe je dat moet doen). Het aantal dummies is altijd het aantal antwoordcategorieen - 1. Dus in jouw geval heb je voor x3 en x4 elk 2 dummy variabelen.

Berichten: 92

Re: Analyse met categorische variabelen

Saffron schreef: za 22 mar 2014, 18:44
Welke analyse je moet doen hangt af van het meetniveau van je uitkomst landschapsappreciatie is. Als die continue is, dan kan je regressie of een anova doen. Voor categorische variabelen zul je met dummies moeten werken (als je googelt op 'create dummy variables' dan vind je wel uitleg hoe je dat moet doen). Het aantal dummies is altijd het aantal antwoordcategorieen - 1. Dus in jouw geval heb je voor x3 en x4 elk 2 dummy variabelen.
Landschapsappreciatie werd geëvalueerd met een score van 1 tot 7 met 7 als zeer mooi, dat is dan numerisch veronderstel ik?

Ik dacht:

als je een numerische variabele moet voorspellen aan de hand van zowel een categorische en een numerische, is dat dan geen ANCOVA?

Gebruikersavatar
Berichten: 467

Re: Analyse met categorische variabelen

Dat wordt inderdaad soms ancova genoemd, al is Ancova strict gezien een model met alleen continue covariaten.

Zo'n 7 punts schaal is ordinaal. Er zijn hele volksstammen die zulke ordinale schalen als continue variabele beschouwen en er een lineaire regressie op los laten (als het normaal verdeeld is), maar veel statistici vinden dat not done en vinden dat je dan een model moet gebruiken dat geschikt is voor ordinale uitkomsten. Een andere optie is dichotomiseren van de uitkomstmaat en daarmee een logistische regressie doen.

Reageer