regressie
Moderator: ArcherBarry
-
- Berichten: 10
regressie
Lineaire regressie van een rechte lijn
Getallen voorbeeld:
x
0
20
40
60
80
100
Y
0
240105,56
1062201,50
2093936,16
3074151,99
4294549,37
In excel berekend:
correlatie :0,985204572
R.kwadraat:0,970628049
Ik heb altijd gedacht dat R.kwadraat en Correlatie hetzelfde zijn. Aan de hand van dit getallen voorbeeld klopt het niet.
Wat is het verschil tussen R.kwadraat en correlatie?
Getallen voorbeeld:
x
0
20
40
60
80
100
Y
0
240105,56
1062201,50
2093936,16
3074151,99
4294549,37
In excel berekend:
correlatie :0,985204572
R.kwadraat:0,970628049
Ik heb altijd gedacht dat R.kwadraat en Correlatie hetzelfde zijn. Aan de hand van dit getallen voorbeeld klopt het niet.
Wat is het verschil tussen R.kwadraat en correlatie?
-
- Berichten: 10
Re: regressie
Hallo rappe28,
Dank je voor je reactie. Ik heb het uitgerekend.
Het klopt inderdaad.
Dank je.
Dank je voor je reactie. Ik heb het uitgerekend.
Het klopt inderdaad.
Dank je.
-
- Berichten: 2.035
Re: regressie
Je gebruikt het kwadraat omdat fouten elkaar anders opheffen..... als een meetwaarde bijv. 0,5 boven de echte waarde zit, en een ander er 0,5 onder zit, zou je bij "gewoon" optellen als resultaat 0,5 - 0,5 = 0 (dus foutloos) krijgen!
Kwadrateer je, dan krijg je 0,52 + -0,52 = 0,5 als de gemiddelde fout!
Kwadrateer je, dan krijg je 0,52 + -0,52 = 0,5 als de gemiddelde fout!
- Berichten: 6.853
Re: regressie
Ik denk niet dat R-kwadraat wordt uitgerekend als een kwadraat omdat er anders door foutencompensatie nul uitkomt. Dat geldt wel voor heel veel andere waarden die ten grondslag liggen aan een kleinste kwadraten fit.
Er is naast Herman's redenering nog een hele goede reden waarom vaak wordt gekwadrateerd: de wiskunde achter het minimaliseren van de som van de kwadraten is verbluffend eenvoudig. Daarom is het nogal uitnodigend om het zo te doen. Maar er zijn wel beperkingen: als er bijvoorbeeld heel slechte datapunten in je gegevens voorkomen, krijgen die bij de bepaling van een regressie een onbehoorlijk zwaar gewicht. Eigenlijk werkt een kleinste-kwadratenfit alleen maar als de fout "normaal" (Gaussisch) is verdeeld. Verder is een kleinste kwadratenregressie soms numeriek instabiel; het moet dus goed worden geprogrammeerd. En ook zijn er een aantal vooronderstellingen over het onafhankelijk zijn van de parameters die worden gefit. En over de gefitte waarde: bij de meeste fit-technieken wordt verondersteld dat de x-waarden geen meetfout bevatten.
Er is een heel goed alternatief in de "robuuste" fit, die niet de kwadratische maar de absolute afwijking minimaliseert. Deze is veel moeilijker wiskundig gezien, maar relatief ongevoelig voor enkele meetfouten.
Er is naast Herman's redenering nog een hele goede reden waarom vaak wordt gekwadrateerd: de wiskunde achter het minimaliseren van de som van de kwadraten is verbluffend eenvoudig. Daarom is het nogal uitnodigend om het zo te doen. Maar er zijn wel beperkingen: als er bijvoorbeeld heel slechte datapunten in je gegevens voorkomen, krijgen die bij de bepaling van een regressie een onbehoorlijk zwaar gewicht. Eigenlijk werkt een kleinste-kwadratenfit alleen maar als de fout "normaal" (Gaussisch) is verdeeld. Verder is een kleinste kwadratenregressie soms numeriek instabiel; het moet dus goed worden geprogrammeerd. En ook zijn er een aantal vooronderstellingen over het onafhankelijk zijn van de parameters die worden gefit. En over de gefitte waarde: bij de meeste fit-technieken wordt verondersteld dat de x-waarden geen meetfout bevatten.
Er is een heel goed alternatief in de "robuuste" fit, die niet de kwadratische maar de absolute afwijking minimaliseert. Deze is veel moeilijker wiskundig gezien, maar relatief ongevoelig voor enkele meetfouten.
-
- Berichten: 31
Re: regressie
R is een lineaire verband tussen b.v. de gemeten stnadaard concentratie van een oplossing en respons daarvan(b.v. piek Area of hoogte).
R kwadrat is eignlijk gebruikt om de rechte lijn van twee metingen te kunnen vergelijken.
<table border='0' align='left' cellpadding='3' cellspacing='0'><tr><td padding='0' celspacing='0' align='left'><font size='1'># Moderatoropmerking</font></td></tr><tr><td id='moderator'><font size='1'>Beryllium: let je even op de datum van het topic voordat je gaat reageren? Na bijna 2 jaar is dat echt niet meer nodig.</font></td></tr></table>
<div class='postcolor'>
R kwadrat is eignlijk gebruikt om de rechte lijn van twee metingen te kunnen vergelijken.
<table border='0' align='left' cellpadding='3' cellspacing='0'><tr><td padding='0' celspacing='0' align='left'><font size='1'># Moderatoropmerking</font></td></tr><tr><td id='moderator'><font size='1'>Beryllium: let je even op de datum van het topic voordat je gaat reageren? Na bijna 2 jaar is dat echt niet meer nodig.</font></td></tr></table>
<div class='postcolor'>