betrouwbaarheidsintervallen

Moderators: dirkwb, Xilvo

Forumregels
(Middelbare) school-achtige vragen naar het forum "Huiswerk en Practica" a.u.b.
Zie eerst de Huiswerkbijsluiter
Berichten: 51

betrouwbaarheidsintervallen

Dit is een stukje uit een slide betreffende verklarende statistiek (meer specifiek betrouwbaarheidsintervallen)
a.png
Ik begrijp niet zo goed wat de X1, X2, ... voorstellen?

Zou iemand dit willen verduidelijken a.d.h.v. een voorbeeld?

Ik dacht dat bij het onderzoeken van vissen X1 bv. hun lengte onderzoekt, X2 hun kleur, ... Maar we nemen dan van elke stochastiek 1 sample om een steekproef te vormen. Daarvan bereken we dan o.a. het gemiddelde. Dan zou het volgens mij niet kunnen dat mijn redenering klopt aangezien we het gemiddelde nemen van verschillende zaken die onderzocht werden.

Zou iemand dit willen verduidelijken (graag met een voorbeeld)?

Gebruikersavatar
Berichten: 2.229

Re: betrouwbaarheidsintervallen

\(X_i\) is een toevalsgrootheid. De term meetproces zou ik niet gebruiken in een inleidende cursus.

\(X_1\) zou bijvoorbeeld de lengte kunnen zijn van de vissoort en \(X_2\) bijvoorbeeld het gewicht. Een toevalsgrootheid heeft een verdeling die beschreven kan worden met een waarschijnlijkheidsdichtheidsfunctie.

Als je een steekproef neemt en je neemt er een willekeurige vis uit, dan gebruiken we daarvoor kleine letters. \(x_1\) kan bijvoorbeeld de lengte zijn van de vis uit de steekproef, bijvoorbeeld van de specifieke vis die jij gevangen hebt. Meestal bestaat je steekproef uit meer dan één vis, je hebt dus \(x_{1,1}\), \(x_{1,2}\), ... Maar ik ken op dat vlak niet de notatie van je docent. De hoofdletters en de kleine letters zijn wel een algemene conventie.

Gebruikersavatar
Moderator
Berichten: 9.782

Re: betrouwbaarheidsintervallen

wnvl1 schreef: wo 11 mei 2022, 17:20 \(X_1\) zou bijvoorbeeld de lengte kunnen zijn van de vissoort en \(X_2\) bijvoorbeeld het gewicht.
Dat betwijfel ik. {X1,...,Xn} zijn onafhankelijke stochasten met alle dezelfde verdeling.
Dan moeten ze om te beginnen dezelfde eenheid hebben. Ik vermoed dat ze alle dezelfde grootheid betreffen (lengte, bijvoorbeeld).
Wat precies bedoeld wordt is mij ook niet duidelijk.

Gebruikersavatar
Berichten: 2.229

Re: betrouwbaarheidsintervallen

Het feit dat er bij staat 'allen met dezelfde verdeling' wijst wel in die richting. Dus dat gaat inderdaad bij een tweede lezing wel zijn wat de docent bedoelt.

Normaal is wel de conventie dat \(X_1\) en \(X_2\) wel andere grootheden meten.

De docent bedoelt hier dus \(X_1\) is het resultaat van de eerste meting en \(X_2\) is het resultaat van de tweede meting. Beiden hebben dezelfde verdeling.

Het is wel atypisch om de dingen op deze manier aan te brengen, maar niet verkeerd. Al vind ik de notatie \(X_n\) onderaan de slide dan wel een beetje raar in zijn context. De slide had beter gekunnen.

Gebruikersavatar
Moderator
Berichten: 9.782

Re: betrouwbaarheidsintervallen

wnvl1 schreef: wo 11 mei 2022, 17:39 De docent bedoelt hier dus \(X_1\) is het resultaat van de eerste meting en \(X_2\) is het resultaat van de
Ik krijg de indruk dat met \(X_i\) de meting, met \(x_i\) het resultaat wordt bedoelt. Waarom dat onderscheid gemaakt wordt is me niet duidelijk. Maar we missen het verhaal dat er bij verteld werd.

Wat het gemiddelde van meetwaardes is, is duidelijk. Wat het gemiddelde van metingen moet voorstellen niet.

Gebruikersavatar
Berichten: 2.229

Re: betrouwbaarheidsintervallen

Ik bedoel \(X_1\) is het resultaat van de eerste meting met geassocieerde kansverdeling. Die kansverdeling kan bijvoorbeeld een normaal verdeling zijn met gemiddelde 30cm en sd 5cm.

\(x_1\) is dan het gerealiseerde resultaat, bvb de vis uit de eerste meting is 40cm. Niet gemakkelijk om jezelf eenduidig te verwoorden.

Nu ik erover nadenk, gebruik je deze notatie wel voor sommige bewijzen. Als je bijvoorbeeld wil uitzoeken wat de verdeling is van de lengte van 5 vissen. Dan ga je een verdeling moeten opstellen voor \(X_1 + X_2 + X_3 + X_4 + X_5\) en niet zomaar voor \(5X\) want dat is verschillend. In die context is het wel relevant.

Gebruikersavatar
Moderator
Berichten: 9.782

Re: betrouwbaarheidsintervallen

wnvl1 schreef: wo 11 mei 2022, 17:58 Ik bedoel \(X_1\) is het resultaat van de eerste meting
//
\(x_1\) is dan het gerealiseerde resultaat, bvb de vis uit de eerste meting is 40cm.
Wat is het verschil? ;)

Gebruikersavatar
Berichten: 2.229

Re: betrouwbaarheidsintervallen

Het verschil zit in het woord gerealiseerd.

Stel we gaan ganzenbord spelen. Het resultaat van mijn eerste worp heeft een verdeling. Minimum is 1, maximum is 6, gemiddelde is 3.5, sd = .... Dit is \(X_1\). Ik werp nu met de dobbelsteen en nu ligt het resultaat vast. Ik heb een 4 geworpen. \(x_1\) is 4. Dit is een steekproef uit het bijna oneindig aantal manieren waarop een dobbelsteen kan bewegen tijdens het werpen.

Maar ik begrijp dat het woord resultaat de lezer mogelijk op het verkeerde been kan zetten. Want dat suggereert bij velen waarschijnlijk de gedachte van een gerealiseerd resultaat na voltooiing van het experiment.

Gebruikersavatar
Moderator
Berichten: 9.782

Re: betrouwbaarheidsintervallen

wnvl1 schreef: wo 11 mei 2022, 18:16 Maar ik begrijp dat het woord resultaat de lezer mogelijk op het verkeerde been kan zetten.
Klopt. En de index. Wat is het verschil tussen \(X_1\) en \(X_2\)? Hoe bepaal je het gemiddelde en standaardafwijking van de metingen, niet van de meetresultaten?

Gebruikersavatar
Berichten: 2.229

Re: betrouwbaarheidsintervallen

\(X_1\) verwijst naar mijn eerste worp. \(X_2\) is mijn tweede worp en \(X_{10}\) is de verdeling van mijn tiende worp. Stel dat het spel altijd 10 worpen duurt.

Als we tijdens het spel heel de tijd met dezelfde dobbelsteen blijven spelen, dan zal de verdeling van \(X_1\), \(X_2\), ... tot \(X_{10}\)dezelfde zijn. Je zou die verdeling kunnen voorstellen door \(X\).

Als nu de vraag is, hoe ziet de verdeling van de som van mijn tien worpen eruit, dan moeten we op zoek naar de verdeling van \(X_1+X_2+...+X_{10}\). Deze verdeling is NIET gelijk aan de verdeling van \(10X_1\) of van \(10X\).

\(X_1+X_2+...+X_{10}\) en \(10X_1\) zullen wel dezelfde verwachte waarde hebben, maar bijvooorbeeld een verschillende standaarddeviatie. De exacte berekening laat ik hier achterwege. In deze context is het werken met die indices voor eerste, tweede tot tiende meting wel relevant.

ps Ik maak me de bedenking dat ganzenbord eigenlijk met twee dobbelstenen is.

Gebruikersavatar
Moderator
Berichten: 9.782

Re: betrouwbaarheidsintervallen

wnvl1 schreef: wo 11 mei 2022, 18:30 Als nu de vraag is, hoe ziet de verdeling van de som van mijn tien worpen eruit, dan moeten we op zoek naar de verdeling van \(X_1+X_2+...+X_{10}\). Deze verdeling is NIET gelijk aan de verdeling van \(10X_1\) of van \(10X\).
Volgens mij is de verdeling van \(X_1+X_2+...+X_{10}\) juist wèl gelijk aan die van \(10X\).

Gebruikersavatar
Berichten: 1.605

Re: betrouwbaarheidsintervallen

Ik begrijp niet goed wat er allemaal gebeurt.

Uit de opening post herleid ik:

Neem een sample \(\small x_i\) uit verzameling \(\small \{X_1, X_2, X_3, X_4 \ldots X_n\}\).

Neem \(\small i\) samples uit de verzameling:

\(\small x_1 \in \{X_1, X_2, X_3, X_4 \ldots X_n\}\)
\(\small x_2 \in \{X_1, X_2, X_3, X_4 \ldots X_n\}\)
\(\small x_3 \in \{X_1, X_2, X_3, X_4 \ldots X_n\}\)
\(\ldots\)
\(\small x_i \in \{X_1, X_2, X_3, X_4 \ldots X_n\}\)

Het gemiddelde uit de steekproef van de \(\small x\)'s (kleine) \(\small \bar{x}\) is een benadering van het populatie gemiddelde \(\small \bar{X}\).

Ik lees uit OP het thema betrouwbaarheid intervallen en niet het optellen van verschillende verdelingen volgens mij.

Het gebruik van hoofd en kleine letters vind k erg verwarrend in dit voorbeeld. Maar mijn routine is een beetje weg.

Gebruikersavatar
Berichten: 2.229

Re: betrouwbaarheidsintervallen

Nee, dat heeft te maken met de onafhankelijkheid van de metingen.

Ik geef een voorbeeld. Het gewicht van een vis is normaal verdeeld met gemiddelde 500g en standaarddeviatie 50g.

Ik bekijk nu twee gevallen.

A. Ik vang één vis en vermenigvuldig zijn gewicht met 10.
B. Ik vang 10 vissen en tel hun gewichten op.

Hebben A en B nu dezelfde verdeling?
Nee, de standaarddeviatie van A is 10*50g = 500g. De standaarddeviatie van B is wortel(10)*50g <> 500g.

A correspondeert met \(10X\) en B met \(X_1 + ... + X_{10}\).

Gebruikersavatar
Moderator
Berichten: 9.782

Re: betrouwbaarheidsintervallen

wnvl1 schreef: wo 11 mei 2022, 18:46
A. Ik vang één vis en vermenigvuldig zijn gewicht met 10.
B. Ik vang 10 vissen en tel hun gewichten op.

Hebben A en B nu dezelfde verdeling?
Dan heb je het over de \(x_i\)'s, niet over de \(X_i\)'s

\(X_i\) is geen getal, maar een verdeling.

Gebruikersavatar
Berichten: 2.229

Re: betrouwbaarheidsintervallen

Nee, ik heb het over \(X_i\). Ik ben aan het nadenken over mijn experiment. Ik spreek in mijn hele post niet over een concrete vis die ik heb gevangen. Het gaat over de verdelingen van de resultaten die ik zou bekomen. Daarom dat ik in heel het verhaal alleen maar hoofdletters gebruik.

Reageer