Springen naar inhoud

Relatieve cumulatieve frequentiepolygoon


  • Log in om te kunnen reageren

#1

zpidermen

    zpidermen


  • >1k berichten
  • 1623 berichten
  • Ervaren gebruiker

Geplaatst op 28 september 2012 - 08:28

Ik heb een probleem met het tekenen van een relatieve cumulatieve frequentiepolygoon. Ik heb deze nodig om snel de bijbehorende boxplot te kunnen tekenen.
Ik heb de volgende tabel:

Waarnemingsgetal 0 1 2 3 4 5
Rel. cum. freq. 10,7 39,3 57,2 75,1 85,8 100

Wanneer ik m.b.v. deze tabel de relatieve cumulatieve frequentiepolygoon wil tekenen, begint de lijn niet ergens bij de x-as. En daar zit nu ergens het probleem.

Wanneer ik een frequentiepolygoon of een relatieve frequentiepolygoon wil tekenen, begint (en eindigt) de lijn ook niet bij de x-as, maar dan moet je de lijn gewoon doortrekken naar de x-as (één eenheid naar links en dan naar de x-as). Wanneer ik hetzelfde doe bij de relatieve cumulatieve frequentiepolygoon, gaat het fout. Want de voor de boxplot benodigde waarden die ik uit de relatieve cumulatieve frequentiepolygoon wil aflezen, komen niet overeen met de waarden die m'n rekenmachine aangeeft voor kleinste waarnemingsgetal, Q1, mediaan, Q3 en grootste waarnemingsgetal. Het kleinste waarnemingsgetal is volgens de tabel namelijk 0, maar daar begint de lijn niet bij de x-as; de rel. cum. freq. bij waarnemingsgetal 0 is namelijk 10,7... En dat terwijl de grafiek bij de x-as moet beginnen. Want anders kan ik ook niet bij 25% aflezen wat de waarde van Q1 moet zijn...

Ik hoop dat m'n probleem duidelijk is. Wie kan mij uitleggen hoe je bij deze tabel een relatieve cumulatieve frequentiepolygoon kan tekenen?
Beter kaal als geen haar want een kip snurkt

Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

zpidermen

    zpidermen


  • >1k berichten
  • 1623 berichten
  • Ervaren gebruiker

Geplaatst op 01 oktober 2012 - 11:31

Ik ben eerlijk gezegd verbaasd, dat er op m'n vraag nog niemand heeft gereageerd... De relatieve cumulatieve frequentiepolygoon is iets wat op HAVO 4 wordt behandeld, zij het summier. Je zou dus verwachten dat er op dit forum voldoende kennis aanwezig is om m'n vraag te kunnen beantwoorden.

Het is niet zo dat ik zo snel mogelijk antwoord wil. Het heeft voor mij persoonlijk geen haast. Maar laat ik wat meer informatie bij de vraag geven.

De frequentietabel ziet er als volgt uit:

Waarnemingsgetal 0 1 2 3 4 5
Freq. 3 8 5 5 3 4

De bijbehorende relatieve cumulatieve frequentie staat in de tabel bij m'n vorige bericht.Wanneer ik bij de frequentietabel een boxplot wil maken, moet ik de kleinste waarde, Q1, mediaan, Q3 en de grootste waarde bepalen. Volgens m'n grafische rekenmachine is dit:

kleinste waarde: 0
Q1: 1
mediaan: 2
Q3: 3,5
grootste waarde: 5

Nu stelt Q1 de waarde bij 25% van alle waarnemingsgetallen voor. Deze waarde is dus 1.

Maar nu de relatieve cumulatieve frequentiepolygoon... Zie de afbeelding hieronder:

RelCumFreqPol.jpg

Q1 kun je bij de relatieve cumulatieve frequentiepolygoon aflezen, wanneer je bij 25% een lijntje trekt naar de grafiek en vervolgens vanuit de grafiek een verticaal lijntje naar de x-as trekt. De waarde voor Q1 die ik hier aflees is 0,5 in plaats van 1... Dus wat gaat hier fout?

Veranderd door zpidermen, 01 oktober 2012 - 11:43

Beter kaal als geen haar want een kip snurkt

#3

Xenion

    Xenion


  • >1k berichten
  • 2606 berichten
  • Moderator

Geplaatst op 01 oktober 2012 - 12:10

De cumulatieve kansfunctie geeft de kans dat een waarneming kleiner of gelijk is aan de waarde op de x as. De waarde die jij afleest zegt dus: er is 25% kans om een waarde kleiner of gelijk aan 0.5 te hebben. Dat komt omdat de grafiek geïnterpoleerd is tussen 0 en 1, wat misschien eigenlijk niet zo goed is voor dit soort data.

Om Q1 en Q3 te bepalen kan je de data opsplitsen aan de mediaan. Dan krijg je de 50% kleinste en grootste waarden. Die 2 nieuwe datasets hebben elk ook een mediaan en die kan je gebruiken voor Q1 en Q3. (bron)

#4

zpidermen

    zpidermen


  • >1k berichten
  • 1623 berichten
  • Ervaren gebruiker

Geplaatst op 01 oktober 2012 - 21:40

Als het interpoleren bij dit soort data eigenlijk niet zo goed is, wat voor soort data heb je dan nodig om de relatieve cumulatieve frequentiepolygoon te kunnen tekenen?

Ik heb bewust een kleine tabel met maar weinig waarnemingsgetallen gebruikt. Ik had ook een tabel met veel meer waarnemingsgetallen kunnen gebruiken, maar m'n vraag blijft dan hetzelfde: hoe moet je de grafiek tekenen aan de linkerkant? Moet de lijn doorlopen tot aan de x-as? Maar als dat zo is, dan moet er ook een frequentie van 0 in de frequentietabel te vinden zijn.

Ik begrijp uit je opmerking over interpoleren, dat ik goed onderscheid moet maken tussen discreet en continu; daar had ik nog niet bij stilgestaan. In mijn voorbeeld heeft het dus geen enkele zin om bij zo'n klein aantal waarnemingsgetallen een relatieve cumulatieve frequentiepolygoon te tekenen. Pas bij een voldoende groot aantal waarnemingsgetallen heeft dat zin. Maar hoe zit het met het al dan niet doortrekken van de lijngrafiek naar de x-as?
Beter kaal als geen haar want een kip snurkt

#5

Xenion

    Xenion


  • >1k berichten
  • 2606 berichten
  • Moderator

Geplaatst op 01 oktober 2012 - 22:16

Voor zover ik weet is er geen regel dat die moet beginnen in de oorsprong ofzo. De enige regel is dat de functie in de limiet naar - en + oneindig respectievelijk 0 en 1 is.

Wat betreft dat discreet/continu, ik denk dat het een kwestie van smaak is welke je liever hebt: een geïnterpoleerde curve of een trapfunctie. Ik denk dat je gewoon voorzichtig moet zijn dat je er geen onzin uithaalt zoals 25% van de ondervraagden hebben een half kind in het gezin ofzo.

#6

EvilBro

    EvilBro


  • >5k berichten
  • 6703 berichten
  • VIP

Geplaatst op 03 oktober 2012 - 08:23

De waarde voor Q1 die ik hier aflees is 0,5 in plaats van 1... Dus wat gaat hier fout?

Als ik dat zo vluchtig bekijk krijg ik het idee dat jouw rekenmachine bij de x-as een half optelt. Dus de punten worden (0.5,10.7), (1.5,39.3), enz. Als je dan interpoleert kom je volgens mij op de waarden die gegeven zijn voor Q1 en Q3.





0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures