[wiskunde] Correlatie matrix

Moderators: ArcherBarry, Fuzzwood

Reageer
Gebruikersavatar
Berichten: 247

Correlatie matrix

Hoi, even een eenvoudige vraag: voor een statistische test moet ik een correlatiematrix uitvoeren (van mijn data).

Wanneer ik die doe, dan zijn er waarden die boven '1' gaan. Kan en mag dat?

Want ik heb tot nu toe alleen maar matrices gezien waar de diagonaal 1 was en al de rest lager (0 tot 0.99). Of kan je evengoed zeggen dat hoe groter de getallen zijn, hoe groter de correlatie?

Of moet ik mijn data eerst omzetten zodat hun eindtotaal 1 is?

Bedankt!

Gebruikersavatar
Berichten: 2.609

Re: Correlatie matrix

Dat lijkt mij een kwestie van normalisatie. Als je de kruiscorrelatie tussen 2 variabelen X en Y berekent dan bereken je de covariantie en deel je door het product van de standaardafwijkingen (zie ook hier). Volgens mij heb je nu een covariantiematrix en geen correlatiematrix.

Je kan inderdaad nu al zeggen dat een groot getal waarschijnlijk overeenkomt met een sterke correlatie, maar dat is moeilijk te zeggen, want wat is immers 'groot' als je getallen niet genormaliseerd zijn?

Gebruikersavatar
Berichten: 247

Re: Correlatie matrix

Oke, dus best eerst normaliseren en dan kijken ten opzichte van die 1 of er al dan niet sterke correlatie is?

Bedankt!

Gebruikersavatar
Berichten: 2.609

Re: Correlatie matrix

Ja dat is toch wat ik vermoed. Succes :)

Gebruikersavatar
Berichten: 247

Re: Correlatie matrix

Het is gek, want ook al normaliseer ik mijn data, toch krijg ik soms waarden boven 1....

Als ik elk datapunt deel door de som van alle datapunten, normaliseer ik toch?

Want als ik dan alle datapunten optel kom ik uit op 1

Gebruikersavatar
Berichten: 2.609

Re: Correlatie matrix

Je moet niet je data normaliseren, je moet zien dat de correlaties die je berekent genormaliseerd zijn. Ik vermoed dat je nu enkel de covariantie berekent? Die zal afhangen van de varianties van de 2 variabelen, daarom dat je die covariantie moet delen door het product van de standaardafwijkingen om een genormaliseerde correlatie te bekomen:
\(corr(X,Y)=\frac{cov(X,Y)}{\sigma_X \sigma_Y} = \frac{E\left [ (X-E[X])(Y-E[Y]) \right ]}{\sigma_X \sigma_Y}\)

Reageer