Springen naar inhoud

Temperature measurement, hypothesis, probability


  • Log in om te kunnen reageren

#1

nhl

    nhl


  • >100 berichten
  • 111 berichten
  • Ervaren gebruiker

Geplaatst op 06 juni 2011 - 19:44

> temp$debilt
 [1] 14.9 13.7 14.2 15.3 14.1 18.1 15.7 17.2 17.2 17.0 15.4 17.8 19.3 17.0 15.4 15.9 15.8 16.3 18.9 20.1


Vraag)

The file temp contains measurements of the mean temperature (oC) in the month of July of 20 consecutive years in a number of towns. Consider the mean temperature in July in De Bilt.

A)
Assume that the mean temperature in July in De Bilt can be modeled as a normal random variable with expectation μ = 16 and standard deviation  = 1.5. Determine the probability of a mean temperature in July in De Bilt higher than 18 degrees under this model assumption.


Because some doubt about the normality assumption is justified, we now do not assume normality of the mean temperature in July in De Bilt. Instead, we investigate the probability of a mean temperature in July in De Bilt higher than 18 degrees based
on the 20 measured mean temperatures. For this we note that the probability of a mean temperature in July in De Bilt higher than 18 degrees may also be viewed as the ‘population’ fraction of mean temperatures in July in De Bilt higher than 18 degrees.

B)
Give a point estimate for the ‘population’ fraction of mean temperatures in July in De Bilt higher than 18 degrees.

C)
Compute the 90% margin of error for this estimate and determine a 90% confidence interval for the ‘population’ fraction of mean temperatures in July in De Bilt higher than 18 degrees.

D)
Test with the z-score the null hypothesis that the ‘population’ fraction of mean temperatures in July in De Bilt higher than 18 degrees is equal to 0.25 against the alternative that this fraction is smaller than 0.25. Take significance level 10%.

E)
Is it appropriate to use the test based on the normality of the Z-score for these data, as we did in part d? Why (not)?


================================
Mijn antwoorden tot zover!
================================
A)
> pnorm(18, 16, 1.5, lower.tail=FALSE)
[1] 0.09121122

We know that the variable is normally distributed. So, X≈N(16 ,1.5). So, the probability of a mean temperature in July in De Bilt higher than 18 degrees is 0.09121122.

B)
> n = length(temp$debilt)
> n
[1] 20
> k = sum(temp$debilt > 18)
> k
[1] 4
> pbar = k/n
> pbar
[1] 0.2

The point estimate for the population fraction of mean temp. in July in De Bilt higher than 18 is 0.2.


C)
> n = length(temp$debilt)
> n
[1] 20
> k = sum(temp$debilt > 18)
> k
[1] 4
> pbar = k/n
> pbar
[1] 0.2
> SE = sqrt(pbar*(1-pbar)/n)
> SE
[1] 0.08944272
> E = qnorm(.975)*SE
> E
[1] 0.1753045
> pbar + c(-E, E)
[1] 0.02469549 0.37530451

At 90% confidence level, between 2.47% and 37.53% of mean temperatures in July in De Bilt are highet than 18 degrees, and the margin of error is 17.5%



D)
Hypothesis
H0: P = 0.25
Ha: P < 0.25

P from H0 = 0.25
P (1 - P) from H0 = 0.75

> pbar
[1] 0.2
> Z = (pbar - 0.25) / (sqrt(0.25*0.75) / sqrt(20))
> Z
[1] -0.5163978

The table value of Z is 0.3085
P = 0.3085

P > 0.10, so we accept H0.

The conclusion is that the P value is greater than the significant level, 0.3085 > 0.10, so we accept H_0.

Zijn mijn antwoorden correct tot zover??

Veranderd door nhl, 06 juni 2011 - 19:50


Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

Drieske

    Drieske


  • >5k berichten
  • 10217 berichten
  • Moderator

Geplaatst op 06 juni 2011 - 19:51

Bij A: dit is de kans dat je een gemiddelde van MINDER dan 18 hebt...

EDIT: ik zou gezworen hebben dat toen ik begon met typen die lower.tail = FALSE er nog nie stond :P. Nu is het dus wel correct.

EDIT2: B is ook correct ;). De rest moet ik nog bekijken.

Veranderd door Drieske, 06 juni 2011 - 19:55

Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

#3

nhl

    nhl


  • >100 berichten
  • 111 berichten
  • Ervaren gebruiker

Geplaatst op 06 juni 2011 - 19:58

Bij A: dit is de kans dat je een gemiddelde van MINDER dan 18 hebt...

EDIT: ik zou gezworen hebben dat toen ik begon met typen die lower.tail = FALSE er nog nie stond :P. Nu is het dus wel correct.

EDIT2: B is ook correct ;). De rest moet ik nog bekijken.



haha :P, je hebt gelijk hoor ;), ik had hem eigenlijk niet goed gemaakt nog dernet, ik heb em gelijk verandert :P.

#4

Drieske

    Drieske


  • >5k berichten
  • 10217 berichten
  • Moderator

Geplaatst op 06 juni 2011 - 20:14

Bij C, waarom geldt:
SE = sqrt(pbar*(1-pbar)/n)

Let op, ik bedoel niet dat het mis is hè ;). Het is een vraag.
Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

#5

nhl

    nhl


  • >100 berichten
  • 111 berichten
  • Ervaren gebruiker

Geplaatst op 06 juni 2011 - 20:22

Bij C, waarom geldt:

SE = sqrt(pbar*(1-pbar)/n)

Let op, ik bedoel niet dat het mis is hè ;). Het is een vraag.



Om de standard error estimate uit te rekenen. Om daarna de margin of error uit te kunnen rekenen.
Ik denk dan dat de confidence intervals en significance testing zijn gebaseerd op standard errors, daarom wellicht?

Wat denk je hiervan?

Veranderd door nhl, 06 juni 2011 - 20:28


#6

Drieske

    Drieske


  • >5k berichten
  • 10217 berichten
  • Moderator

Geplaatst op 06 juni 2011 - 20:33

Ik zie voorlopig helaas niet wrm de standard error of estimate daaraan gelijk is... Maar evt neem ik gwn aan da da klopt. Staat dat in je cursus/boek?
Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

#7

nhl

    nhl


  • >100 berichten
  • 111 berichten
  • Ervaren gebruiker

Geplaatst op 06 juni 2011 - 20:43

Ik zie voorlopig helaas niet wrm de standard error of estimate daaraan gelijk is... Maar evt neem ik gwn aan da da klopt. Staat dat in je cursus/boek?



Hieronder een van de slides van school. Dat heet geloof ik standaard afwijking in het NL.
Geplaatste afbeelding

Voor de rest heb ik eventjes online gezocht, maar ik weet dus ook niet of dat een goed voorbeeld was.

Veranderd door nhl, 06 juni 2011 - 20:43


#8

Drieske

    Drieske


  • >5k berichten
  • 10217 berichten
  • Moderator

Geplaatst op 06 juni 2011 - 20:44

Dat zijn toch heel andere formules dan jij gebruikt? Verder snap ik sowieso niet waarom je de SE zo berekent... R heeft daar een commando voor, net zoals voor mean. En volgens mij heb je dat commando zelfs al gebruikt ;).

Veranderd door Drieske, 06 juni 2011 - 20:45

Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

#9

nhl

    nhl


  • >100 berichten
  • 111 berichten
  • Ervaren gebruiker

Geplaatst op 06 juni 2011 - 20:47

Dat zijn toch heel andere formules dan jij gebruikt?



Maar hoe reken je de Error Marge in R, dit is toch met de functie qnorm? (los van de Standaard error)
Bedoel je soms de SD functie ? ;)

Veranderd door nhl, 06 juni 2011 - 20:50


#10

Drieske

    Drieske


  • >5k berichten
  • 10217 berichten
  • Moderator

Geplaatst op 06 juni 2011 - 20:50

Maar hoe reken je de Error Marge in R, dit is toch met de functie qnorm? (los van de Standaard error)

Dat is okee ja ;). Alleen vragen ze wel niet het 95%-betrouwbaarheidsinterval. Wel het 90%... Maar je formule voor SE klopt niet denk ik (dit is wel een "echte" denk ik :P).

EDIT: ik zie net dat in je bijlage bij de berekening van E nog gedeeld wordt door sqrt{n}. Dit doe jij niet.

En die bedoel ik idd.

Veranderd door Drieske, 06 juni 2011 - 20:55

Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

#11

nhl

    nhl


  • >100 berichten
  • 111 berichten
  • Ervaren gebruiker

Geplaatst op 06 juni 2011 - 21:06

Dat is okee ja ;). Alleen vragen ze wel niet het 95%-betrouwbaarheidsinterval. Wel het 90%... Maar je formule voor SE klopt niet denk ik (dit is wel een "echte" denk ik :P).

EDIT: ik zie net dat in je bijlage bij de berekening van E nog gedeeld wordt door sqrt{n}. Dit doe jij niet.

En die bedoel ik idd.



Oke, wacht eens even ;), de qnorm functie bevat toch alle benodigde berekeningen die van E?
Dus, waarom zou ik nog sqrt(n) moeten erbijvoegen terwijl qnorm functie alles al afhandelt? Of zie ik het niet goed?

E = qnorm(.9)	  /* 90% */

Hoe zou ik dan wel de Error marge afhandelen met qnorm (met sqrt(n) dan?)



Dus eerst het volgende:
> n = length(temp$debilt)
> n
[1] 20
> k = sum(temp$debilt > 18)
> k
[1] 4
> pbar = k/n
> pbar
[1] 0.2

En dan:
E = qnorm(.9) ??? hoe moet ik het combineren met pbar etc?

Veranderd door nhl, 06 juni 2011 - 21:12


#12

Drieske

    Drieske


  • >5k berichten
  • 10217 berichten
  • Moderator

Geplaatst op 06 juni 2011 - 21:11

Die qnorm heb je nodig voor het 95%-kwantiel (of het 90%, het zijn mar vb). Dat is dus die 2 in jouw vb... Wat je dus moet doen, is
SD <- sd(temp$debilt)
E <- qnorm(.95) SD/sqrt(n)

EDIT: ik zie niet waarvoor je die pbar nodig zou hebben, buiten om nu + en - E te doen...

Veranderd door Drieske, 06 juni 2011 - 21:14

Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

#13

nhl

    nhl


  • >100 berichten
  • 111 berichten
  • Ervaren gebruiker

Geplaatst op 06 juni 2011 - 21:19

Die qnorm heb je nodig voor het 95%-kwantiel (of het 90%, het zijn mar vb). Dat is dus die 2 in jouw vb... Wat je dus moet doen, is

SD <- sd(temp$debilt)
E <- qnorm(.95) SD/sqrt(n)

EDIT: ik zie niet waarvoor je die pbar nodig zou hebben, buiten om nu + en - E te doen...



Ok, wat denk je hiervan?
> n
[1] 20
SD <- sd(temp$debilt)
> SD
[1] 1.76375
E <- qnorm(.95) SD/sqrt(n
> E
[1] 0.6487082
> mean(n) + c(-E, E)
[1] 19.35129 20.64871

Veranderd door nhl, 06 juni 2011 - 21:21


#14

Drieske

    Drieske


  • >5k berichten
  • 10217 berichten
  • Moderator

Geplaatst op 06 juni 2011 - 21:22

Ja, volgens mij klopt dat zo wel ja ;)..

Kun je nu bij D zelf de nodige aanpassingen doen?

PS: ik vraag me nog steeds af waarom je bij SE "pbar*(1-pbar)" deed...

Veranderd door Drieske, 06 juni 2011 - 21:23

Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

#15

nhl

    nhl


  • >100 berichten
  • 111 berichten
  • Ervaren gebruiker

Geplaatst op 06 juni 2011 - 21:24

Ja, volgens mij klopt dat zo wel ja ;)..

Kun je nu bij D zelf de nodige aanpassingen doen?

PS: ik vraag me nog steeds af waarom je bij SE "pbar*(1-pbar)" deed...



Ok ik ga even D doen, kijk maar even hiernaar:

http://www.r-tutor.c...nknown-variance

Ik heb hier voorbeelden van gehaald, ik wist het dus niet of het goed was.
Ik hoor het nog van je :P





0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures