Relatieve cumulatieve frequentiepolygoon

Moderators: dirkwb, Xilvo

Reageer
Gebruikersavatar
Berichten: 1.623

Relatieve cumulatieve frequentiepolygoon

Ik heb een probleem met het tekenen van een relatieve cumulatieve frequentiepolygoon. Ik heb deze nodig om snel de bijbehorende boxplot te kunnen tekenen.

Ik heb de volgende tabel:
Waarnemingsgetal 0 1 2 3 4 5
Rel. cum. freq. 10,7 39,3 57,2 75,1 85,8 100
Wanneer ik m.b.v. deze tabel de relatieve cumulatieve frequentiepolygoon wil tekenen, begint de lijn niet ergens bij de x-as. En daar zit nu ergens het probleem.

Wanneer ik een frequentiepolygoon of een relatieve frequentiepolygoon wil tekenen, begint (en eindigt) de lijn ook niet bij de x-as, maar dan moet je de lijn gewoon doortrekken naar de x-as (één eenheid naar links en dan naar de x-as). Wanneer ik hetzelfde doe bij de relatieve cumulatieve frequentiepolygoon, gaat het fout. Want de voor de boxplot benodigde waarden die ik uit de relatieve cumulatieve frequentiepolygoon wil aflezen, komen niet overeen met de waarden die m'n rekenmachine aangeeft voor kleinste waarnemingsgetal, Q1, mediaan, Q3 en grootste waarnemingsgetal. Het kleinste waarnemingsgetal is volgens de tabel namelijk 0, maar daar begint de lijn niet bij de x-as; de rel. cum. freq. bij waarnemingsgetal 0 is namelijk 10,7... En dat terwijl de grafiek bij de x-as moet beginnen. Want anders kan ik ook niet bij 25% aflezen wat de waarde van Q1 moet zijn...

Ik hoop dat m'n probleem duidelijk is. Wie kan mij uitleggen hoe je bij deze tabel een relatieve cumulatieve frequentiepolygoon kan tekenen?
Beter kaal als geen haar want een kip snurkt

Gebruikersavatar
Berichten: 1.623

Re: Relatieve cumulatieve frequentiepolygoon

Ik ben eerlijk gezegd verbaasd, dat er op m'n vraag nog niemand heeft gereageerd... De relatieve cumulatieve frequentiepolygoon is iets wat op HAVO 4 wordt behandeld, zij het summier. Je zou dus verwachten dat er op dit forum voldoende kennis aanwezig is om m'n vraag te kunnen beantwoorden.

Het is niet zo dat ik zo snel mogelijk antwoord wil. Het heeft voor mij persoonlijk geen haast. Maar laat ik wat meer informatie bij de vraag geven.

De frequentietabel ziet er als volgt uit:
Waarnemingsgetal 0 1 2 3 4 5
Freq. 3 8 5 5 3 4
De bijbehorende relatieve cumulatieve frequentie staat in de tabel bij m'n vorige bericht.Wanneer ik bij de frequentietabel een boxplot wil maken, moet ik de kleinste waarde, Q1, mediaan, Q3 en de grootste waarde bepalen. Volgens m'n grafische rekenmachine is dit:

kleinste waarde: 0

Q1: 1

mediaan: 2

Q3: 3,5

grootste waarde: 5

Nu stelt Q1 de waarde bij 25% van alle waarnemingsgetallen voor. Deze waarde is dus 1.

Maar nu de relatieve cumulatieve frequentiepolygoon... Zie de afbeelding hieronder:
RelCumFreqPol.jpg
RelCumFreqPol.jpg (114.59 KiB) 985 keer bekeken
Q1 kun je bij de relatieve cumulatieve frequentiepolygoon aflezen, wanneer je bij 25% een lijntje trekt naar de grafiek en vervolgens vanuit de grafiek een verticaal lijntje naar de x-as trekt. De waarde voor Q1 die ik hier aflees is 0,5 in plaats van 1... Dus wat gaat hier fout?
Beter kaal als geen haar want een kip snurkt

Gebruikersavatar
Berichten: 2.609

Re: Relatieve cumulatieve frequentiepolygoon

De cumulatieve kansfunctie geeft de kans dat een waarneming kleiner of gelijk is aan de waarde op de x as. De waarde die jij afleest zegt dus: er is 25% kans om een waarde kleiner of gelijk aan 0.5 te hebben. Dat komt omdat de grafiek geïnterpoleerd is tussen 0 en 1, wat misschien eigenlijk niet zo goed is voor dit soort data.

Om Q1 en Q3 te bepalen kan je de data opsplitsen aan de mediaan. Dan krijg je de 50% kleinste en grootste waarden. Die 2 nieuwe datasets hebben elk ook een mediaan en die kan je gebruiken voor Q1 en Q3. (bron)

Gebruikersavatar
Berichten: 1.623

Re: Relatieve cumulatieve frequentiepolygoon

Als het interpoleren bij dit soort data eigenlijk niet zo goed is, wat voor soort data heb je dan nodig om de relatieve cumulatieve frequentiepolygoon te kunnen tekenen?

Ik heb bewust een kleine tabel met maar weinig waarnemingsgetallen gebruikt. Ik had ook een tabel met veel meer waarnemingsgetallen kunnen gebruiken, maar m'n vraag blijft dan hetzelfde: hoe moet je de grafiek tekenen aan de linkerkant? Moet de lijn doorlopen tot aan de x-as? Maar als dat zo is, dan moet er ook een frequentie van 0 in de frequentietabel te vinden zijn.

Ik begrijp uit je opmerking over interpoleren, dat ik goed onderscheid moet maken tussen discreet en continu; daar had ik nog niet bij stilgestaan. In mijn voorbeeld heeft het dus geen enkele zin om bij zo'n klein aantal waarnemingsgetallen een relatieve cumulatieve frequentiepolygoon te tekenen. Pas bij een voldoende groot aantal waarnemingsgetallen heeft dat zin. Maar hoe zit het met het al dan niet doortrekken van de lijngrafiek naar de x-as?
Beter kaal als geen haar want een kip snurkt

Gebruikersavatar
Berichten: 2.609

Re: Relatieve cumulatieve frequentiepolygoon

Voor zover ik weet is er geen regel dat die moet beginnen in de oorsprong ofzo. De enige regel is dat de functie in de limiet naar - en + oneindig respectievelijk 0 en 1 is.

Wat betreft dat discreet/continu, ik denk dat het een kwestie van smaak is welke je liever hebt: een geïnterpoleerde curve of een trapfunctie. Ik denk dat je gewoon voorzichtig moet zijn dat je er geen onzin uithaalt zoals 25% van de ondervraagden hebben een half kind in het gezin ofzo.

Berichten: 7.068

Re: Relatieve cumulatieve frequentiepolygoon

zpidermen schreef: ma 01 okt 2012, 12:31De waarde voor Q1 die ik hier aflees is 0,5 in plaats van 1... Dus wat gaat hier fout?
Als ik dat zo vluchtig bekijk krijg ik het idee dat jouw rekenmachine bij de x-as een half optelt. Dus de punten worden (0.5,10.7), (1.5,39.3), enz. Als je dan interpoleert kom je volgens mij op de waarden die gegeven zijn voor Q1 en Q3.

Reageer