Standaarddeviaties optellen

Moderators: dirkwb, Xilvo

Forumregels
(Middelbare) school-achtige vragen naar het forum "Huiswerk en Practica" a.u.b.
Zie eerst de Huiswerkbijsluiter
Reageer
Berichten: 4

Standaarddeviaties optellen

Ik heb bewerkingstjden van 2 activiteiten. Hiervan heb ik het gemiddelde en de standaard deviatie bepaald per activiteit.

Nu wil ik de gemiddelde tijd van de twee activiteiten samen weten en de standaard deviatie hierop.

Het gemiddelde bepalen lukt wel, maar de sd kom ik niet uit.

Als voorbeeld even de situatie:

Ik heb 10 appels, die allemaal gewassen moeten worden. De gemiddelde tijd hiervan is 1 minuut en de sd = 0,149

Van die 10 appels worden er 5 na het wassen ook nog ontdaan van de rotte plekken. Het ontdoen van rotte plekken heeft een gemiddelde tijd van 1 minuut en een sd = 0,158

Aangezien de helft van de appels maar hoeft worden ontdaan van de rotte plekken is de gemiddelde totale tijd 1,5 min.

Maar wat is de standaard deviatie en hoe bepaal je die?

Gebruikersavatar
Pluimdrager
Berichten: 10.058

Re: Standaarddeviaties optellen

De wortel uit de som van de kwadraten!

Berichten: 4

Re: Standaarddeviaties optellen

ja dat dacht ik in eerste instantie ook, maar gevoelsmatig klopt dat niet.

Als ik mijn voorbeeld aanpas dat ik het volgende heb:

Ik heb 10 appels, die allemaal gewassen moeten worden. De gemiddelde tijd hiervan is 1 minuut en de sd = 0,149

Van die 10 appels worden er 5 na het wassen ook nog ontdaan van de rotte plekken. Het ontdoen van rotte plekken heeft een gemiddelde tijd van 10 minuut en een sd = 1,58

Aangezien de helft van de appels maar hoeft worden ontdaan van de rotte plekken is de gemiddelde totale tijd 6 min.

Dan kom ik dan op een sd van 1,59. In werkelijkheid ligt die echter ergens rond de 5,5 (de 5 tijden in de buurt van de 1 minuut (die alleen gewassen worden) en de 5 in de buurt van de 11 minuten, die ook van rotte plekken ontdaan worden)

Jouw antwoord is alleen van toepassing als beide groepen even groot zouden zijn geweest.

Gebruikersavatar
Berichten: 284

Re: Standaarddeviaties optellen

Je kunt alleen varianties op tellen. De standaarddeviatie is de wortel uit de variantie.

De variantie van de wastijd van een appel is \((0,149 \minuten)^{2} = 0,022201 \minuten^{2}\).

De variantie van de totale wastijd van tien appels is tien keer zo groot: \(10\cdot 0,022201 \minuten^{2} = 0,22201 \minuten^{2}\).

De variantie van het "ontrotten" van een appel is \((0,158 \minuten)^{2} = 0,024964 \minuten^{2}\).

De variantie van het "ontrotten" van vijf appels is vijf keer zo groot: \(5\cdot 0,024964 \minuten^{2} = 0,12482 \minuten^{2}\).

Hoe nu verder?

De variantie van de totale bewerkingstijd van tien appels is \(0,22201 \minuten^{2} + 0,12482 \minuten^{2} = 0,34683 \minuten^{2}\).

De variantie van de bewerkingstijd van een appel is groter dan
\(\frac{0,34683 \minuten^{2}}{10} = 0,034683 \minuten^{2}\)
, want je weet niet of je een goede of een rotte appel hebt.

De tijdsvariantie van die onzekerheid is
\(\frac{5 goede a\ppels}{10 a\ppels \totaal}\cdot\frac{5 rotte a\ppels}{10 a\ppels \totaal}\cdot (1 \minuut ontrotten)^{2} = 0,25 \minuten^{2}\)
.

De variantie van de bewerkingstijd van een appel is dan
\(\sqrt{0,034683 \minuten^{2} + 0,25 \minuten^{2}} = \sqrt{0,284683 \minuten^{2}} \approx 0,5336 \minuten\)
(in het onaangepast voorbeeld).

Berichten: 4

Re: Standaarddeviaties optellen

ok dank je. Nu klopt het.

Als iemand mij het idee achter die tijdsvariantie kan uitleggen (hoe bereken je wat nu , waarom deze getallen?) dan zou ik dat echt super vinden!!!

Gebruikersavatar
Berichten: 284

Re: Standaarddeviaties optellen

In jouw aangepast voorbeeld hebben we een kansvariabele (stochast) X met twee mogelijke uitkomsten:

- 10 minuut voor het ondoen van rotte plekken,

- 0 minuten voor het ontdoen van rotte plekken.

De eerste uitkomst heeft succeskans \(p\) (in jouw voorbeeld is deze kans \(\frac{1}{2}\)).

Het gemiddelde \(\mu\):

\(\mu = E(X) = \)

\(= P(X=0)\cdot 0 + P(X=10)\cdot 10 = \)

\(= (1-p)\cdot 0 + p\cdot 10 = \)

\(= 0 + 10p\)

\(= 10p\).

In jouw voorbeeld is dit gemiddelde \(\mu = 10\cdot \frac{1}{2} = 5\).

De variantie \(\sigma ^{2}\) is de verwachte kwadratische afwijking van het gemiddelde \(\mu\):
\(\sigma ^{2} = Var(X) = \)
\(= E[(X-\mu )^{2}] = \)
\(= P(X=0)\cdot(0-\mu)^{2} + P(X=10)\cdot (10-\mu)^{2} = \)
\(= (1-p)\cdot(0-10p)^{2} + p\cdot(10-10p)^{2} = \)
\(= (1-p)\cdot 100p^{2} + p(100-20p+100p^{2}) = \)
\(= 100p^{2} - 100p^{3} + 100p - 200p^{2} + 100p^{3} = \)
\(= 100p - 100p^{2} = \)
\(= 100\cdot p(1-p)\)
In jouw voorbeeld is de variantie \(\sigma ^{2} = 100\cdot \frac{1}{2}(1-\frac{1}{2}) = 25\).

In je oorspronkelijk voorbeeld, waarbij het ontrotten gemiddeld 1 minuut duurt, is de variantie \(\sigma ^{2} = \frac{1}{2}(1-\frac{1}{2}) = 0,25\).

Berichten: 336

Re: Standaarddeviaties optellen

In dit voorbeeld ligt natuurlijk wel een valkuil. Zijn alle stochasten namelijk wel onafhankelijk. Hiermee bedoel ik:

Stel de tijd die nodig is om een appel te ontdoen van rotte plekken hangt alleen af van de werknemer die de appel behandelt. Als het gemiddelde van 1 min met sd=0,158 min nu de statistiek van de werknemers beschrijft zijn er twee mogelijkheden:

Dezelfde werknemer doet alle vijf de appels: nu moet je de sd met 5 vermenigvuldigen ipv de variantie.

5 verschillende werknemers ontdoen de appels van de rotte plekken: nu moet de variantie met 5 worden vermenigvuldigd.

Verder is inderdaad wat phi hung aanhaalt ook een belangrijke, echter het is niet per definitie waar. Als bijvoorbeeld na het onstaan van rotte plekken in de helft van de appels wordt besloten de appels te plukken, dan is het dus de fractie appelen met rotte plekken precies de helft en niet meer stochastisch. Echter phi hung's interpretatie is waarschijnlijker.
Duct tape is like the force: it has a dark side, a light side and it holds the universe together.

Gebruikersavatar
Berichten: 284

Re: Standaarddeviaties optellen

Dezelfde werknemer doet alle vijf de appels: nu moet je de sd met 5 vermenigvuldigen ipv de variantie.
Je moet de standaarddeviatie alleen met 5 vermenigvuldigen, als er maximale correlatie is tussen ontrottingstijden van de verschillende appels. Dat zou betekenen dat deze werknemer voor elke appel precies even veel tijd nodig heeft. Maar dan is de standaarddeviatie nul voor deze werknemer. In het voorbeeld van questionmark is dit niet zo.
Verder is inderdaad wat phi hung aanhaalt ook een belangrijke, echter het is niet per definitie waar.
De berekende standaarddeviatie voor de verwerkingstijd van een appel hangt niet af van het wel of niet stochastisch zijn van het aantal rotte appels.

In het voorbeeld zijn er vijf rotte appels. Dat klinkt deterministisch. Als het aantal rotte appels stochastisch zou zijn, dan zou de variantie voor het ondoen van de rotte plekken van de rotte appels groter zijn dan 0,12482, want we weten dan nog niet hoeveel van de tien appels rotte plekken zullen hebben.

Echter, dit heeft geen invloed op de standaarddeviatie of de variantie van de bewerkingstijd van een enkele appel, want de kans dat er rotte plekken zitten op een willekeurige appel, die is sowieso 1/2.

Berichten: 336

Re: Standaarddeviaties optellen

Je moet de standaarddeviatie alleen met 5 vermenigvuldigen, als er maximale correlatie is tussen ontrottingstijden van de verschillende appels. Dat zou betekenen dat deze werknemer voor elke appel precies even veel tijd nodig heeft. Maar dan is de standaarddeviatie nul voor deze werknemer. In het voorbeeld van questionmark is dit niet zo.
Ja, nu ik het inderdaad nog een keer lees is het moeilijk om het als zodanig te interpreteren.
De berekende standaarddeviatie voor de verwerkingstijd van een appel hangt niet af van het wel of niet stochastisch zijn van het aantal rotte appels.
Ik neem aan dat je dit zegt omdat in het voorbeeld het aantal rotte appels voor de gevraagde berekening al is vastgelegd. Klopt dat?
Echter, dit heeft geen invloed op de standaarddeviatie of de variantie van de bewerkingstijd van een enkele appel, want de kans dat er rotte plekken zitten op een willekeurige appel, die is sowieso 1/2.
********, je hebt alweer gelijk...

Maar mijn valkuil blijft bestaan, althans, daar geloof ik in. Een correllatie tussen de schoonmaaktijd van een appel en het wel of niet rot zijn zal denk ik wel roet in het eten gooien. De vraag is echter of dit in realiteit significant zal zijn: waarschijnlijk niet.

Misschien moeten we mijn gezever maar overboord gooien en aannemen dat deze en andere problemen veroorzakende correllaties niet bestaan.
Duct tape is like the force: it has a dark side, a light side and it holds the universe together.

Reageer