Springen naar inhoud

Efficient indelen data in groepen


  • Log in om te kunnen reageren

#1

Dire

    Dire


  • 0 - 25 berichten
  • 1 berichten
  • Gebruiker

Geplaatst op 30 november 2012 - 13:59

Ik heb een tabel waarin grote hoeveelheden diktes staan. Het gewicht is het gevolg van deze diktes (geen 1op1 verhouding).

Wij mogen altijd hogere diktes toepassen, maar nooit lagere. Nu willen wij deze lijst indelen in groepen, zie het voorbeeld. De lijst is nooit hetzelfde en nooit evenlang. Nog zijn de groepen gelijk in hoeveelheid, maar deze mikken wij meestal op 6 stuks.

Dit doen wij iedere keer handmatig waarbij iemand steeds de afweging maakt hoeveel groepen toe te passen waar deze splitsing te maken.


Nu is mijn vraag, is hier niet een wetenschappelijke benadering voor, zodat wij dit in een formule kunnen verwerken, of een visual basic loopje van te maken.


Met vriendelijk groet,
Daniel

Bijgevoegde miniaturen

  • groepen.png

Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

dannypje

    dannypje


  • >250 berichten
  • 595 berichten
  • Ervaren gebruiker

Geplaatst op 30 november 2012 - 16:59

Je kan uiteraard altijd een programmaatje schrijven om deze verdeling te maken, maar als je zegt dat iemand handmatig kijkt en dan beslist hoeveel groepen er gemaakt moeten worden, denk ik dat je zal moeten trachten te modelleren hoe die iemand zijn beslissing neemt.

Je zou lineair kunnen splitsen, afhankelijk van hoeveel groepen je wil. Anderzijds zou je ook rekening kunnen houden met een zekere 'verdeling' van de gewichten (ttz. als er veel afstand is tussen gewichten zou je die kunnen groeperen, en daar waar de gewichten dichter bij mekaar liggen meer groepen gaan toekennen. Dan zou je de distributie van de gewichten moeten opstellen en op basis daarvan beslissen. Zelf niet zeker hoe je dit best zou aanpakken.
In the beginning, there was nothing. Then he said:"Light". There was still nothing but you could see it a whole lot better now.

#3

Drieske

    Drieske


  • >5k berichten
  • 10217 berichten
  • Moderator

Geplaatst op 30 november 2012 - 17:22

Opmerking moderator :

Verplaatst naar Programmeren.
Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

#4

Xenion

    Xenion


  • >1k berichten
  • 2606 berichten
  • Moderator

Geplaatst op 30 november 2012 - 17:28

Er bestaat een techniek die K-means clustering heet.

Simpel uitgelegd onderstel je dat je in een dataset K verschillende groepen hebt. Elk van die groepen heeft een gemiddelde. Een datapunt hoor tot de groep waarvan het gemiddelde het dichtste bij is.

Het algoritme zal iteratief de K gemiddeldes proberen te bepalen die voor een goeie indeling zorgen.





0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures