Springen naar inhoud

Betrouwbaarheidsintervallen


  • Log in om te kunnen reageren

#1

yvesvdv

    yvesvdv


  • >25 berichten
  • 76 berichten
  • Ervaren gebruiker

Geplaatst op 25 januari 2012 - 10:03

vraagje: als 2 betrouwbaarheidsintervallen niet overlappen is er dan 100 % zekerheid dat er een significant verschil is tussen 2 groepen op een bepaald significantieniveau? Zoja, waarom?

Veranderd door yvesvdv, 25 januari 2012 - 10:04


Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

hanzwan

    hanzwan


  • >100 berichten
  • 132 berichten
  • Ervaren gebruiker

Geplaatst op 25 januari 2012 - 10:17

Als je ze allebei test met dezelfde % voor het significantie niveau dan is dit waar. Echter, het omgekeerde is niet waar: Het is fout om te concluderen dat er geen statistisch verschil is omdat de twee confidence intervallen overlappen. Ik zou je een voorbeeld kunnen uittypen maar hier word het ook duidelijk uitgelegd:

http://www.cscu.corn...ws/stnews73.pdf

#3

yvesvdv

    yvesvdv


  • >25 berichten
  • 76 berichten
  • Ervaren gebruiker

Geplaatst op 25 januari 2012 - 12:09

heel erg bedankt voor je snelle reactie!!

Ik begrijp wat je als voorbeeld geeft en waarom dat als 2 BI elkaar overlappen het niet altijd significant is maar mijn vraag is eigenlijk: WAAROM kunnen we besluiten als 2 betrouwbaarheidsintervallen elkaar niet overlappen dat ze significant verschillend zijn?


Alvast bedankt en groeten,

Yvesvdv

#4

hanzwan

    hanzwan


  • >100 berichten
  • 132 berichten
  • Ervaren gebruiker

Geplaatst op 25 januari 2012 - 16:16

misschien dat ik je een intuÔtief argument kan geven:

Stel dat we bijvoorbeeld het slagings-percentage van 2 scholen testen. Een hoger percentage is dan ook een betere school. Als we gebaseerd op de statistieken concluderen dat de ene school met 95% zekerheid een slagingspercentage heeft van tussen de 65 en de 75%, en de andere heeft met 95% zekerheid een slagingspercentage van tussen de 76 en de 85%, wat betekent dit dan?

Dit betekent dat we, wanneer we bijvoorbeeld 100 keer deze twee dezelfde scholen zouden testen dan zou van die 100 keer, 95 keer eruit komen dat het slagingspercentage tussen de 65 en 75% zit, en voor die andere school zou dan van de 100 keer, 95 keer voorkomen dat het gemiddelde tussen de 76 en 85% zit. Dit is de interpretatie van een confidence interval. Maar 5 keer (5%) zouden we ernaast zitten, dit zouden we kunnen toeschrijven aan toeval/pech.

Nu zie je dus dat we met 95% zekerheid kunnen zeggen dat school 1 binnen gebied A [65 t/m 75%] scored en B met een zekerheid van 95% in gebied B [76 t/m 84%] scored. Als deze gebieden elkaar zouden overlappen (wat ze niet doen) dan zouden we kunnen zeggen: "wacht even, de scholen zouden even goed kunnen zijn, want er is zou misschien een goede kans aanwezig zijn dat A een gemiddelde score heeft van bijvoorbeeld 76 en B ook, dus zouden ze in dat geval even goed zijn. Echter, omdat we met 95% zekerheid weten dat A nooit evengoed zal zijn als B, wat dus ook betekent dat we met 95% zekerheid weten dat B altijd beter zal zijn dan A, kunnen we op dit significantie niveau concluderen dat de twee scholen verschillen in kwaliteit en dat A dus slechter is dan B.

Heb je hier wat aan?

#5

yvesvdv

    yvesvdv


  • >25 berichten
  • 76 berichten
  • Ervaren gebruiker

Geplaatst op 25 januari 2012 - 18:02

Ja ik heb er zeker iets aan, heel goed uitgelegd, heel erg bedankt!

Ik zou er toch nog even willen op doorgaan. Lijkt dit u nu de meest aangewezen werkwijze? Ik denk persoonlijk van wel omdat er mij toch altijd is gezegd geweest omdat betrouwbaarheidsintervallen u meer informatie verschaffen dan een toets.

Je zou ook nog volgens mij een ongepaarde t-test kunnen uitvoeren als bv in u voorbeeld de gemiddelden gegeven zijn.
In de veronderstelling dat de populatievarianties gelijk zijn zou ik de gepoolde steekproefvariantie bereken en dan mijn teststatistiek uitrekenen.Kan dit volgens u? Is het dan ook mogelijk om de steefproefvarianties uit de betrouwbaarheidsintervallen te halen?



groeten,

yvesvdv

#6

hanzwan

    hanzwan


  • >100 berichten
  • 132 berichten
  • Ervaren gebruiker

Geplaatst op 25 januari 2012 - 19:04

Wat de beste werkwijze is ligt eigenlijk aan wat je graag wilt aantonen. Confidence intervallen worden meestal gegeven om een situatieschets te maken en gaan dan meestal over 1 bepaalde populatie. Zo wordt het in de winst-mogelijkheden van aandelen bijvoorbeeld vaak gebruikt om te kijken wat er, gebaseerd op een 95% zekerheid, verwacht kan worden. Dat je deze confidence intervallen dan tegen elkaar af kan zetten is handig maar is niet waar de test primair voor gebruikt wordt.

Als de nadruk primair ligt op het aantonen van verschillen tussen populaties zou ik in die situatieschets inderdaad liever voor een ongepaarde T-test gaan. Dit omdat het makkelijker te interpreteren is en meestal wat eenvoudiger uit te rekenen. Zoals je zelf al aangeeft kan een pooled-variance test gebruikt worden wanneer je veronderstelt dat de variatie in beide populaties hetzelfde is. Ga zelf dan ook altijd na waarom je vind/denkt dat dit zo is voordat je deze variatie gebruikt. In het voorbeeld kan de variatie van beide populaties best hetzelfde zijn, echter, er zijn ook talloze situaties te bedenken waarom dit niet het geval is.

Weet je hoe een confidence interval wordt berekent? Bij een confidence interval wordt er een interval ontwikkeld rondom het gevonden gemiddelde van de steekproef. Ervan uitgaande dat we het over normale verdelingen hebben, dan is de verdeling om het gevonden gemiddelde dus symmetrisch. Dit betekent dat de afstand tot het midden op de linker en rechtergrens even groot is. Hoe vinden we die grens? Dit hang af van de zekerheid die je wilt hebben (95,90 of een ander percentage); daarnaast hangt het af van de de grootte van de steekproef en de geobserveerde variatie in de sample.

Dus, weer uitgaande van de normaal verdeling, als jij de grootte van de steekproef en het betrouwbaarheids-percentage =(confidence level) weet, dan kun je inderdaad uitrekenen wat de variance is. Om dit zelf te zien raad ik je aan de beneden staande wikipedia link te gebruiken en bij examples het eerste practical example door te nemen.

http://en.wikipedia....idence_interval

Na het te hebben doorgenomen kun je terugwerken naar de variance door alleen de boundaries , de Z-score (betrouwbaarheid) en sample size te gebruiken.

Succes





0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures