Springen naar inhoud

Statistiek


  • Log in om te kunnen reageren

#1

Skyliner

    Skyliner


  • >100 berichten
  • 247 berichten
  • Ervaren gebruiker

Geplaatst op 20 januari 2012 - 09:59

'Lo

In mijn cursus biostatistiek komen zoals waarschijnlijk in alle statistiek cursussen 'vrijheidsgraden' voor. Van al die jaren dat ik statistiek heb gezien, heb ik nooit écht begrepen wat het betekent. Ik weet dat dit n-1 is, maar daar stopt het ook.

Kan iemand mij liefst mét een voorbeeld even laten zien wat vrijheidsgraden juist zijn? Want formele definities kan ik evengoed elders op het internet vinden.

gisteren wilde ik een generalised additive model (GAM) opstellen, maar de programmering liep fout doordat mijn vrijheidsgraden niet in orde waren...

Ik dank jullie alvast voor het antwoord!

Skyliner

Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

In physics I trust

    In physics I trust


  • >5k berichten
  • 7384 berichten
  • Moderator

Geplaatst op 20 januari 2012 - 22:39

Kan je jouw formele definitie even laten zien? Dan zijn we zeker dat we over hetzelfde spreken. In jouw 'n-1', is n dan je steekproefgrootte? In dat geval:


De formule voor de steekproefvariantieLaTeX is:

LaTeX

Je hebt dus n elementen in je steekproef, die allemaal kunnen variëren (willekeurig genomen, dus niet afhankelijk van elkaar, dus vrij) als je uitgaat van een aselecte steekproef. OMdat je hiermee je gemiddelde berekent, gebruik je in die formule alle gegevens al een keer, dus eigenlijk gebruik je een vrijheidsgraad op omdat je een afhankelijkheid beschrijft: LaTeX wordt berekend uit de overige LaTeX en is dus niet 'vrij'.

Dat is uiteraard een intuïtieve uitleg en weinig wiskundig, maar dat is waar je geloof ik nu wel naar op zoek bent?
"C++ : Where friends have access to your private members." — Gavin Russell Baker.

#3

Skyliner

    Skyliner


  • >100 berichten
  • 247 berichten
  • Ervaren gebruiker

Geplaatst op 21 januari 2012 - 14:47

de formele definitie staat zo in het boek:

d.f. = n-k

met n, welke de sample size is (zoals je vermeldde), min het aantal parameters (gemiddelde, zoals je ook zei) 'k', geschat van de data. Oke tot zover bedankt voor de verheldering, maar elke keer als men vrijheidsgraden aanhaalt of in een zin gebruikt, begrijp ik niet zo goed wat die er nu juist bij komen doen.

Zo staat er bijvoorbeeld ergens: '....The criterion used is AIC, Akaike's Information Criterion. In the jargon, this is a 'penalized log-likelihood'. What this means in simple terms is that it weighs up the inevitable trade-off between degrees of freedom and fit of the model. You can have a perfect fit if you have a parameter for every data point, but this model has zero explanatory power. Thus deviance goes down as degrees of freedom in the model go up.'

Wat wil men hier juist mee zeggen?

#4

In physics I trust

    In physics I trust


  • >5k berichten
  • 7384 berichten
  • Moderator

Geplaatst op 22 januari 2012 - 00:00

Stel: je hebt een wereldbevolking van 8 miljard mensen en je wil een uitspraak doen over de schoenmaat van onze wereldburgers. De standaardafwijking is een maat voor de verwachte spreiding op je berekende gemiddelde. Je wil natuurlijk dat die afwijking zo klein mogelijk blijft. Hoe doe je dit nu? Wel je gaat een grotere steekproef proberen nemen, en uit de formule blijkt inderdaad dat de standaardafwijking daalt. A la limite heb je je steekproef uitgebreid (DOF omhoog) tot de hele wereldbevolking en op dit punt doe je niet meer aan statistiek: dat is een meting en niets meer.
"C++ : Where friends have access to your private members." — Gavin Russell Baker.

#5

Skyliner

    Skyliner


  • >100 berichten
  • 247 berichten
  • Ervaren gebruiker

Geplaatst op 22 januari 2012 - 11:29

Achzo, ja :) nu zie ik het. Eigenlijk heel eenvoudig! Bedankt!





0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures