Springen naar inhoud

Effect monotone transformatie


  • Log in om te kunnen reageren

#1

QuarkSV

    QuarkSV


  • >250 berichten
  • 723 berichten
  • Ervaren gebruiker

Geplaatst op 16 oktober 2012 - 17:27

Hallo

Wanneer je een monotone transformatie uitvoert op gegevens, dan is het gemiddelde van je oorspronkelijke gegevens niet gelijk aan het gemiddelde van je getransformeerde transformatie. Maar beschouw je echter de mediaan van de oorspronkelijke gegevens, dan is die wel gelijk aan de mediaan van de getransformeerde gegevens. Dit is ook zo voor bv het 10%-kwantiel...

Ik verwachtte dat mediaan (en gemiddelde) bij transformatie gingen veranderen omdat dit centrumkenmerken zijn. Dit i.t.t. bv standaardafwijking (spreidingskenmerk) die niet verandert bij transformatie...

Kan iemand me helpen begrijpen waarom de mediaan en een ...%-kwantiel niet veranderen bij een monotone transformatie van de gegevens, terwijl het gemiddelde wel?

Alvast bedankt

Help WSF eiwitten vouwen in de VRIJE TIJD van je computer...

Surf & download: folding.stanford.edu. Team nummer: 48658.


Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

physicalattraction

    physicalattraction


  • >1k berichten
  • 3103 berichten
  • Moderator

Geplaatst op 17 oktober 2012 - 08:19

Elke waarde onder de mediaan zal na de transformatie onder de waarde van de getransformeerde mediaan zitten, anders is de transformatie niet monotoon. Analoog voor elke waarde boven de mediaan, die zal na de transformatie boven de waarde van de getransformeerde mediaan zitten. Met andere woorden: de helft van de waarden die eerst onder de mediaan zaten, zullen dat na de transformatie nog steeds zijn, en de helft van de waarden die eerst boven de mediaan zaten, zullen dat na de transformatie ook nog steeds zijn, dus de getransformeerde mediaan is tevens de mediaan van alle getransformeerde waarden.

Misschien kun je zelf een mooi bewijs (bijv. uit het ongerijmde) opstellen hiervan.

#3

QuarkSV

    QuarkSV


  • >250 berichten
  • 723 berichten
  • Ervaren gebruiker

Geplaatst op 18 oktober 2012 - 09:56

Maar waarom is dit dan niet zo bij het gemiddelde?

Ik moet vooral een uitleg in woorden kunnen geven, niet zozeer een bewijs.

Help WSF eiwitten vouwen in de VRIJE TIJD van je computer...

Surf & download: folding.stanford.edu. Team nummer: 48658.


#4

Xenion

    Xenion


  • >1k berichten
  • 2606 berichten
  • Moderator

Geplaatst op 18 oktober 2012 - 10:38

Maar beschouw je echter de mediaan van de oorspronkelijke gegevens, dan is die wel gelijk aan de mediaan van de getransformeerde gegevens.

Bedoel je hier niet dat de mediaan van de getransformeerde gegevens gelijk is aan de getransformeerde mediaan van de oorspronkelijke gegevens? (Als je immers elk getal +2 doet, dan is de mediaan ook met 2 opgeschoven.)

De mediaan is intuïtief gewoon de middelste waarde in de gesorteerde gegevens. Stel dat je alle waarden boven de mediaan m transformeert naar een constante M en de mediaan zelf naar m', dan is de mediaan van de getransformeerde dataset gelijk aan m', want 50% van de data ligt nog steeds rechts daarvan.

Het gemiddelde zal niet zomaar gelijk zijn aan de transformatie van het gewone gemiddelde omdat je met die monotone transformatie de vorm van de kansdichtheidsfunctie ook verandert hebt.

Onderstel nog steeds die transformatie waarbij alles boven de mediaan naar een constante M wordt gebracht en M is een heel groot getal, dan zal het gemiddelde na de transformatie ergens rond M/2 liggen omdat M relatief groot is tov de andere 50% van de gegevens.

Stel dat het oorspronkelijke gemiddelde groter was dan de mediaan m, dan werd dat gemiddelde ook getransformeerd naar M en hier zie je dan dat het gemiddelde van de transformatie (ongeveer M/2) niet gelijk is aan de transformatie van het gemiddelde (M).

#5

physicalattraction

    physicalattraction


  • >1k berichten
  • 3103 berichten
  • Moderator

Geplaatst op 19 oktober 2012 - 13:48

Misschien kun je het grafisch representeren. Teken twee getallenlijnen van 0 tot 100. Teken op de eerste lijn tien stipjes op de plekken 1, 2, ..., 10. Maak nu een monotone transformatie, dus teken een pijl van elke stip op de eerste lijn naar een nieuwe waarde op de tweede lijn. Het feit dat de transformatie monotoon moet zijn, wil zeggen dat deze lijnen elkaar niet mogen snijden. Hieruit zie je gelijk dat de mediaan van de getransformeerde waarden de getransformeerde van de originele mediaan is, en evenzo voor elk ander kwantiel.

Het is nu ook eenvoudig in te zien dat het gemiddelde van de getransformeerde waarden niet per se de getransformeerde van het originele gemiddelde hoeft te zijn. Wanneer je de eerste negen lijntjes getekend hebt, kun je het gemiddelde van de getransformeerde waarden nog aanpassen door het tiende lijntje aan te passen. Echter, het getransformeerde gemiddelde staat los hiervan, want deze had je al bepaald.Hieruit volgt dat je nooit in alle gevallen kunt zeggen dat de gemiddelde getransformeerde gelijk is aan het getransformeerde gemiddelde.

#6

QuarkSV

    QuarkSV


  • >250 berichten
  • 723 berichten
  • Ervaren gebruiker

Geplaatst op 22 oktober 2012 - 13:02

Bedoel je hier niet dat de mediaan van de getransformeerde gegevens gelijk is aan de getransformeerde mediaan van de oorspronkelijke gegevens? (Als je immers elk getal +2 doet, dan is de mediaan ook met 2 opgeschoven.)

Inderdaad, dit bedoelde ik.

Het gemiddelde zal niet zomaar gelijk zijn aan de transformatie van het gewone gemiddelde omdat je met die monotone transformatie de vorm van de kansdichtheidsfunctie ook verandert hebt.

Dit begrijp ik niet echt... Dit heeft geen invloed op de mediaan dan?

Misschien kun je het grafisch representeren. Teken twee getallenlijnen van 0 tot 100. Teken op de eerste lijn tien stipjes op de plekken 1, 2, ..., 10. Maak nu een monotone transformatie, dus teken een pijl van elke stip op de eerste lijn naar een nieuwe waarde op de tweede lijn. Het feit dat de transformatie monotoon moet zijn, wil zeggen dat deze lijnen elkaar niet mogen snijden. Hieruit zie je gelijk dat de mediaan van de getransformeerde waarden de getransformeerde van de originele mediaan is, en evenzo voor elk ander kwantiel.

Het is nu ook eenvoudig in te zien dat het gemiddelde van de getransformeerde waarden niet per se de getransformeerde van het originele gemiddelde hoeft te zijn. Wanneer je de eerste negen lijntjes getekend hebt, kun je het gemiddelde van de getransformeerde waarden nog aanpassen door het tiende lijntje aan te passen. Echter, het getransformeerde gemiddelde staat los hiervan, want deze had je al bepaald.Hieruit volgt dat je nooit in alle gevallen kunt zeggen dat de gemiddelde getransformeerde gelijk is aan het getransformeerde gemiddelde.

Ik zie het in (grafisch), maar ik ben nog niet echt tevreden van mijn uitleg in woorden. Ik kan nu inderdaad wel een grafisch voorbeeld geven, maar algemeen lukt het me niet echt.

Waarin verschilt het gemiddelde van de mediaan waardoor dit een verschil geeft bij dit gegeven? Ik zag onlangs in dat als je een steekproef hebt met een even aantal n elementen dat dit niet volledig meer klopt, dan verschilt de mediaan van de getransformeerde gegevens met de getransformeerde mediaan.

Veranderd door QuarkSV, 22 oktober 2012 - 13:04

Help WSF eiwitten vouwen in de VRIJE TIJD van je computer...

Surf & download: folding.stanford.edu. Team nummer: 48658.


#7

Xenion

    Xenion


  • >1k berichten
  • 2606 berichten
  • Moderator

Geplaatst op 22 oktober 2012 - 13:36

Dit begrijp ik niet echt... Dit heeft geen invloed op de mediaan dan?

Stel dat je een reeks gegevens hebt van:
1,1,1,1,1,2,2,3,4,5,6,7,7,7,8
De mediaan is hier 3. Het gemiddelde is 3.73

De monotone transformatie die ik kies is de volgende.
Als x <= 3: x = x, als x > 3, T(x) = 2*x

De getransformeerde gegevens zijn dan
1,1,1,1,1,2,2,3,8,10,12,14,14,14,16
Mediaan = 3 = T(3)
Gemiddelde = 6.6, niet hetzelfde als T(3.73).

Vergelijk:
1,1,1,1,1,2,2,3,4,5,6,7,7,7,8
1,1,1,1,1,2,2,3,8,10,12,14,14,14,16
Omdat de transformatie monotoon is, blijft de volgorde van de getallen bewaard: de mediaan wordt gewoon mee getransformeerd en blijft in het midden liggen.
Het gemiddelde kan wel veranderen omdat je de kansmassa kan opschuiven. In de originele dataset lagen er veel getallen rond 7, maar in de getransformeerde dataset is die massa opgeschoven naar 14, terwijl een ander stuk van de pdf onveranderd bleef.

Het gemiddelde is nu eenmaal een gevoelige waarde. Stel dat de transformatie was dat alle waarden dezelfde bleven, maar 8 ineens naar 1000 getransformeerd wordt, dan blijft de mediaan weer liggen, maar het gemiddelde is dan bijna 66, terwijl de originele waarde van het gemiddelde na de transformatie dezelfde gebleven is.

#8

physicalattraction

    physicalattraction


  • >1k berichten
  • 3103 berichten
  • Moderator

Geplaatst op 23 oktober 2012 - 08:24

Ik zag onlangs in dat als je een steekproef hebt met een even aantal n elementen dat dit niet volledig meer klopt, dan verschilt de mediaan van de getransformeerde gegevens met de getransformeerde mediaan.

Dat komt omdat de mediaan van een even aantal elementen het concept gemiddelde weer gebruikt, en dus kan het veranderen bij een transformatie.

Maar als je het grafisch kan uitleggen, dan ben je er toch? Als je echt geen plaatje wil gebruiken, beschrijf dan wat je ziet. Dat probeerde ik hierboven ook. Maar aangezien je op zoek bent naar een intuïtieve uitleg in plaats van een hard bewijs, lijkt het me meer dan reëel om gewoon een plaatje te gebruiken.





0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures