Efficient indelen data in groepen

Moderators: jkien, Xilvo

Reageer
Berichten: 1

Efficient indelen data in groepen

Ik heb een tabel waarin grote hoeveelheden diktes staan. Het gewicht is het gevolg van deze diktes (geen 1op1 verhouding).

Wij mogen altijd hogere diktes toepassen, maar nooit lagere. Nu willen wij deze lijst indelen in groepen, zie het voorbeeld. De lijst is nooit hetzelfde en nooit evenlang. Nog zijn de groepen gelijk in hoeveelheid, maar deze mikken wij meestal op 6 stuks.

Dit doen wij iedere keer handmatig waarbij iemand steeds de afweging maakt hoeveel groepen toe te passen waar deze splitsing te maken.

Nu is mijn vraag, is hier niet een wetenschappelijke benadering voor, zodat wij dit in een formule kunnen verwerken, of een visual basic loopje van te maken.

Met vriendelijk groet,

Daniel
Bijlagen
groepen.png
groepen.png (6.34 KiB) 406 keer bekeken

Gebruikersavatar
Berichten: 768

Re: Efficient indelen data in groepen

Je kan uiteraard altijd een programmaatje schrijven om deze verdeling te maken, maar als je zegt dat iemand handmatig kijkt en dan beslist hoeveel groepen er gemaakt moeten worden, denk ik dat je zal moeten trachten te modelleren hoe die iemand zijn beslissing neemt.

Je zou lineair kunnen splitsen, afhankelijk van hoeveel groepen je wil. Anderzijds zou je ook rekening kunnen houden met een zekere 'verdeling' van de gewichten (ttz. als er veel afstand is tussen gewichten zou je die kunnen groeperen, en daar waar de gewichten dichter bij mekaar liggen meer groepen gaan toekennen. Dan zou je de distributie van de gewichten moeten opstellen en op basis daarvan beslissen. Zelf niet zeker hoe je dit best zou aanpakken.
In the beginning, there was nothing. Then he said:"Light". There was still nothing but you could see it a whole lot better now.

Gebruikersavatar
Berichten: 10.179

Re: Efficient indelen data in groepen

Opmerking moderator

Verplaatst naar Programmeren.
Zoek je graag naar het meest interessante wetenschapsnieuws? Wij zoeken nog een vrijwilliger voor ons nieuwspostteam.

Gebruikersavatar
Berichten: 2.609

Re: Efficient indelen data in groepen

Er bestaat een techniek die K-means clustering heet.

Simpel uitgelegd onderstel je dat je in een dataset K verschillende groepen hebt. Elk van die groepen heeft een gemiddelde. Een datapunt hoor tot de groep waarvan het gemiddelde het dichtste bij is.

Het algoritme zal iteratief de K gemiddeldes proberen te bepalen die voor een goeie indeling zorgen.

Reageer