Correlatie (bivariate) met gewogen gemiddelden

WineDine

Een dataset bevat metingen van respondenten in verschillende (46) landen. Het aantal respondenten per land verschilt (nogal); 2 tot 250. Ik wil gemiddelde scores (per land) van een variabele nu correleren met externe (unobtrusive) indexvariabelen. Ik heb Pearson's r en Spearman's Rho uitgerekend en in SPSS een filter gebruikt van N>25. Dan blijven er zo'n 30 landen over. Dit levert in enkele gevallen een statistisch significante correlatie op (soms Spearman, soms Pearson, soms allebei).

Nu heb ik dit eveneens gedaan met gebruik van gewogen gemiddelden. Er ontstaat dan een veel aantrekkelijker (want geprononceerder) plaatje. De reeds gevonden correlaties worden sterker, er komen er nieuwe bij. Intuitief lijken de uitkomsten te kloppen. Ik overweeg in mijn publicatie van beide methoden melding te maken, maar ik ben terughoudend. Want in andere literatuur kom ik deze methode niet tegen (althans niet in mijn vakgebied organisatiecultuur). Dus dan word je vanzelf argwanend. Met gewogen gemiddelden maak je het ene land belangrijker (ongeacht inwonertal, maar gerelateerd aan het aantal metingen) dan het andere en sommige degradeer je in feite tot uitbuiters (outliers). Anderzijds, hoe groter het aantal metingen, hoe groter de kans dat je het échte'gemiddelde meet.

Ik heb dit aan verscheidene collega's voorgelegd en zij komen er niet uit: wel of niet gebruiken? Zie ik met mijn idee iets over het hoofd of is de methode van gewogen gemiddelden wel bruikbaar ?

Wetenschapsforum

Laatste berichten

Nieuwsberichten

Correlatie (bivariate) met gewogen gemiddelden

Correlatie (bivariate) met gewogen gemiddelden