[wiskunde] Correlatie matrix
Moderators: ArcherBarry, Fuzzwood
- Berichten: 247
Correlatie matrix
Hoi, even een eenvoudige vraag: voor een statistische test moet ik een correlatiematrix uitvoeren (van mijn data).
Wanneer ik die doe, dan zijn er waarden die boven '1' gaan. Kan en mag dat?
Want ik heb tot nu toe alleen maar matrices gezien waar de diagonaal 1 was en al de rest lager (0 tot 0.99). Of kan je evengoed zeggen dat hoe groter de getallen zijn, hoe groter de correlatie?
Of moet ik mijn data eerst omzetten zodat hun eindtotaal 1 is?
Bedankt!
Wanneer ik die doe, dan zijn er waarden die boven '1' gaan. Kan en mag dat?
Want ik heb tot nu toe alleen maar matrices gezien waar de diagonaal 1 was en al de rest lager (0 tot 0.99). Of kan je evengoed zeggen dat hoe groter de getallen zijn, hoe groter de correlatie?
Of moet ik mijn data eerst omzetten zodat hun eindtotaal 1 is?
Bedankt!
- Berichten: 2.609
Re: Correlatie matrix
Dat lijkt mij een kwestie van normalisatie. Als je de kruiscorrelatie tussen 2 variabelen X en Y berekent dan bereken je de covariantie en deel je door het product van de standaardafwijkingen (zie ook hier). Volgens mij heb je nu een covariantiematrix en geen correlatiematrix.
Je kan inderdaad nu al zeggen dat een groot getal waarschijnlijk overeenkomt met een sterke correlatie, maar dat is moeilijk te zeggen, want wat is immers 'groot' als je getallen niet genormaliseerd zijn?
Je kan inderdaad nu al zeggen dat een groot getal waarschijnlijk overeenkomt met een sterke correlatie, maar dat is moeilijk te zeggen, want wat is immers 'groot' als je getallen niet genormaliseerd zijn?
- Berichten: 247
Re: Correlatie matrix
Oke, dus best eerst normaliseren en dan kijken ten opzichte van die 1 of er al dan niet sterke correlatie is?
Bedankt!
Bedankt!
- Berichten: 247
Re: Correlatie matrix
Het is gek, want ook al normaliseer ik mijn data, toch krijg ik soms waarden boven 1....
Als ik elk datapunt deel door de som van alle datapunten, normaliseer ik toch?
Want als ik dan alle datapunten optel kom ik uit op 1
Als ik elk datapunt deel door de som van alle datapunten, normaliseer ik toch?
Want als ik dan alle datapunten optel kom ik uit op 1
- Berichten: 2.609
Re: Correlatie matrix
Je moet niet je data normaliseren, je moet zien dat de correlaties die je berekent genormaliseerd zijn. Ik vermoed dat je nu enkel de covariantie berekent? Die zal afhangen van de varianties van de 2 variabelen, daarom dat je die covariantie moet delen door het product van de standaardafwijkingen om een genormaliseerde correlatie te bekomen:
\(corr(X,Y)=\frac{cov(X,Y)}{\sigma_X \sigma_Y} = \frac{E\left [ (X-E[X])(Y-E[Y]) \right ]}{\sigma_X \sigma_Y}\)