Temperature measurement, hypothesis, probability

Moderators: dirkwb, Xilvo

Berichten: 111

Temperature measurement, hypothesis, probability

Code: Selecteer alles

> temp$debilt

 [1] 14.9 13.7 14.2 15.3 14.1 18.1 15.7 17.2 17.2 17.0 15.4 17.8 19.3 17.0 15.4 15.9 15.8 16.3 18.9 20.1
Vraag)

The file temp contains measurements of the mean temperature (oC) in the month of July of 20 consecutive years in a number of towns. Consider the mean temperature in July in De Bilt.

A)

Assume that the mean temperature in July in De Bilt can be modeled as a normal random variable with expectation μ = 16 and standard deviation = 1.5. Determine the probability of a mean temperature in July in De Bilt higher than 18 degrees under this model assumption.

Because some doubt about the normality assumption is justified, we now do not assume normality of the mean temperature in July in De Bilt. Instead, we investigate the probability of a mean temperature in July in De Bilt higher than 18 degrees based

on the 20 measured mean temperatures. For this we note that the probability of a mean temperature in July in De Bilt higher than 18 degrees may also be viewed as the ‘population’ fraction of mean temperatures in July in De Bilt higher than 18 degrees.

B)

Give a point estimate for the ‘population’ fraction of mean temperatures in July in De Bilt higher than 18 degrees.

C)

Compute the 90% margin of error for this estimate and determine a 90% confidence interval for the ‘population’ fraction of mean temperatures in July in De Bilt higher than 18 degrees.

D)

Test with the z-score the null hypothesis that the ‘population’ fraction of mean temperatures in July in De Bilt higher than 18 degrees is equal to 0.25 against the alternative that this fraction is smaller than 0.25. Take significance level 10%.

E)

Is it appropriate to use the test based on the normality of the Z-score for these data, as we did in part d? Why (not)?

================================

Mijn antwoorden tot zover!

================================

A)

Code: Selecteer alles

> pnorm(18, 16, 1.5, lower.tail=FALSE)

[1] 0.09121122
We know that the variable is normally distributed. So, X≈N(16 ,1.5). So, the probability of a mean temperature in July in De Bilt higher than 18 degrees is 0.09121122.

B)

Code: Selecteer alles

> n = length(temp$debilt)

> n

[1] 20

> k = sum(temp$debilt > 18)

> k

[1] 4

> pbar = k/n

> pbar

[1] 0.2
The point estimate for the population fraction of mean temp. in July in De Bilt higher than 18 is 0.2.

C)

Code: Selecteer alles

> n = length(temp$debilt)

> n

[1] 20

> k = sum(temp$debilt > 18)

> k

[1] 4

> pbar = k/n

> pbar

[1] 0.2

> SE = sqrt(pbar*(1-pbar)/n)

> SE

[1] 0.08944272

> E = qnorm(.975)*SE

> E

[1] 0.1753045

> pbar + c(-E, E)

[1] 0.02469549 0.37530451
At 90% confidence level, between 2.47% and 37.53% of mean temperatures in July in De Bilt are highet than 18 degrees, and the margin of error is 17.5%

D)

Code: Selecteer alles

Hypothesis

H0: P = 0.25

Ha: P < 0.25

P from H0 = 0.25

P (1 - P) from H0 = 0.75

> pbar

[1] 0.2

> Z = (pbar - 0.25) / (sqrt(0.25*0.75) / sqrt(20))

> Z

[1] -0.5163978

The table value of Z is 0.3085

P = 0.3085

P > 0.10, so we accept H0.
The conclusion is that the P value is greater than the significant level, 0.3085 > 0.10, so we accept H_0.

Zijn mijn antwoorden correct tot zover??

Gebruikersavatar
Berichten: 10.179

Re: Temperature measurement, hypothesis, probability

Bij A: dit is de kans dat je een gemiddelde van MINDER dan 18 hebt...

EDIT: ik zou gezworen hebben dat toen ik begon met typen die lower.tail = FALSE er nog nie stond :P . Nu is het dus wel correct.

EDIT2: B is ook correct ;) . De rest moet ik nog bekijken.
Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

Berichten: 111

Re: Temperature measurement, hypothesis, probability

Drieske schreef:Bij A: dit is de kans dat je een gemiddelde van MINDER dan 18 hebt...

EDIT: ik zou gezworen hebben dat toen ik begon met typen die lower.tail = FALSE er nog nie stond :P . Nu is het dus wel correct.

EDIT2: B is ook correct ;) . De rest moet ik nog bekijken.
haha :P , je hebt gelijk hoor ;) , ik had hem eigenlijk niet goed gemaakt nog dernet, ik heb em gelijk verandert :P .

Gebruikersavatar
Berichten: 10.179

Re: Temperature measurement, hypothesis, probability

Bij C, waarom geldt:

Code: Selecteer alles

SE = sqrt(pbar*(1-pbar)/n)


Let op, ik bedoel niet dat het mis is hè ;) . Het is een vraag.
Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

Berichten: 111

Re: Temperature measurement, hypothesis, probability

Drieske schreef:Bij C, waarom geldt:

Code: Selecteer alles

SE = sqrt(pbar*(1-pbar)/n)
Let op, ik bedoel niet dat het mis is hè ;) . Het is een vraag.
Om de standard error estimate uit te rekenen. Om daarna de margin of error uit te kunnen rekenen.

Ik denk dan dat de confidence intervals en significance testing zijn gebaseerd op standard errors, daarom wellicht?

Wat denk je hiervan?

Gebruikersavatar
Berichten: 10.179

Re: Temperature measurement, hypothesis, probability

Ik zie voorlopig helaas niet wrm de standard error of estimate daaraan gelijk is... Maar evt neem ik gwn aan da da klopt. Staat dat in je cursus/boek?
Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

Berichten: 111

Re: Temperature measurement, hypothesis, probability

Ik zie voorlopig helaas niet wrm de standard error of estimate daaraan gelijk is... Maar evt neem ik gwn aan da da klopt. Staat dat in je cursus/boek?
Hieronder een van de slides van school. Dat heet geloof ik standaard afwijking in het NL.

Afbeelding

Voor de rest heb ik eventjes online gezocht, maar ik weet dus ook niet of dat een goed voorbeeld was.

Gebruikersavatar
Berichten: 10.179

Re: Temperature measurement, hypothesis, probability

Dat zijn toch heel andere formules dan jij gebruikt? Verder snap ik sowieso niet waarom je de SE zo berekent... R heeft daar een commando voor, net zoals voor mean. En volgens mij heb je dat commando zelfs al gebruikt ;) .
Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

Berichten: 111

Re: Temperature measurement, hypothesis, probability

Dat zijn toch heel andere formules dan jij gebruikt?
Maar hoe reken je de Error Marge in R, dit is toch met de functie qnorm? (los van de Standaard error)

Bedoel je soms de SD functie ? ;)

Gebruikersavatar
Berichten: 10.179

Re: Temperature measurement, hypothesis, probability

Maar hoe reken je de Error Marge in R, dit is toch met de functie qnorm? (los van de Standaard error)
Dat is okee ja ;) . Alleen vragen ze wel niet het 95%-betrouwbaarheidsinterval. Wel het 90%... Maar je formule voor SE klopt niet denk ik (dit is wel een "echte" denk ik :P ).

EDIT: ik zie net dat in je bijlage bij de berekening van E nog gedeeld wordt door sqrt{n}. Dit doe jij niet.

En die bedoel ik idd.
Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

Berichten: 111

Re: Temperature measurement, hypothesis, probability

Drieske schreef:Dat is okee ja ;) . Alleen vragen ze wel niet het 95%-betrouwbaarheidsinterval. Wel het 90%... Maar je formule voor SE klopt niet denk ik (dit is wel een "echte" denk ik :P ).

EDIT: ik zie net dat in je bijlage bij de berekening van E nog gedeeld wordt door sqrt{n}. Dit doe jij niet.

En die bedoel ik idd.
Oke, wacht eens even ;) , de qnorm functie bevat toch alle benodigde berekeningen die van E?

Dus, waarom zou ik nog sqrt(n) moeten erbijvoegen terwijl qnorm functie alles al afhandelt? Of zie ik het niet goed?

Code: Selecteer alles

E = qnorm(.9)	  /* 90% */
Hoe zou ik dan wel de Error marge afhandelen met qnorm (met sqrt(n) dan?)

Dus eerst het volgende:

Code: Selecteer alles

> n = length(temp$debilt)

> n

[1] 20

> k = sum(temp$debilt > 18)

> k

[1] 4

> pbar = k/n

> pbar

[1] 0.2
En dan:

Code: Selecteer alles

E = qnorm(.9) ??? hoe moet ik het combineren met pbar etc?

Gebruikersavatar
Berichten: 10.179

Re: Temperature measurement, hypothesis, probability

Die qnorm heb je nodig voor het 95%-kwantiel (of het 90%, het zijn mar vb). Dat is dus die 2 in jouw vb... Wat je dus moet doen, is

Code: Selecteer alles

SD <- sd(temp$debilt)

E <- qnorm(.95) SD/sqrt(n)


EDIT: ik zie niet waarvoor je die pbar nodig zou hebben, buiten om nu + en - E te doen...
Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

Berichten: 111

Re: Temperature measurement, hypothesis, probability

Drieske schreef:Die qnorm heb je nodig voor het 95%-kwantiel (of het 90%, het zijn mar vb). Dat is dus die 2 in jouw vb... Wat je dus moet doen, is

Code: Selecteer alles

SD <- sd(temp$debilt)

E <- qnorm(.95) SD/sqrt(n)
EDIT: ik zie niet waarvoor je die pbar nodig zou hebben, buiten om nu + en - E te doen...
Ok, wat denk je hiervan?

Code: Selecteer alles

> n

[1] 20

SD <- sd(temp$debilt)

> SD

[1] 1.76375

E <- qnorm(.95) SD/sqrt(n

> E

[1] 0.6487082

> mean(n) + c(-E, E)

[1] 19.35129 20.64871

Gebruikersavatar
Berichten: 10.179

Re: Temperature measurement, hypothesis, probability

Ja, volgens mij klopt dat zo wel ja ;) ..

Kun je nu bij D zelf de nodige aanpassingen doen?

PS: ik vraag me nog steeds af waarom je bij SE "pbar*(1-pbar)" deed...
Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

Berichten: 111

Re: Temperature measurement, hypothesis, probability

Drieske schreef:Ja, volgens mij klopt dat zo wel ja ;) ..

Kun je nu bij D zelf de nodige aanpassingen doen?

PS: ik vraag me nog steeds af waarom je bij SE "pbar*(1-pbar)" deed...
Ok ik ga even D doen, kijk maar even hiernaar:

http://www.r-tutor.com/elementary-statisti...nknown-variance

Ik heb hier voorbeelden van gehaald, ik wist het dus niet of het goed was.

Ik hoor het nog van je :P

Reageer