Springen naar inhoud

[statistiek] van data naar een passend model


  • Log in om te kunnen reageren

#1

Caps13

    Caps13


  • >25 berichten
  • 29 berichten
  • Gebruiker

Geplaatst op 26 februari 2009 - 10:49

Geachte heren en dames,

Voor een opdracht moeten wij een bepaald model proberen te maken die het vraagproces van producten bij een bedrijf goed kan benaderen. De data is alleen van de werkdagen, in het weekend is er namelijk geen vraag.

In de bijgevoegde excel sheet zal het ťťn en ander verduidelijkt worden:
kolom 1: dag 1 tot dag 26 (werkdagen)
kolom 2: vraag naar product op die dag
kolom 3: kans (berekend door aantal van die dag te delen door totaal)
kolom 4: cumulatieve kans

Bedoeling is een statische verdeling (bijvoorbeeld gamma of exponentiele) verdeling die past bij dit vraagproces, met bijbehorende parameters. Uiteindelijk moet die gekozen verdeling met ingevulde parameters een redelijk goede benadering geven voor het vraagproces.

Wij hebben al veel geprobeerd hoe dit zou moeten, maar komen er niet uit. Probleem is namelijk dat op de maandagen (4 stuks) de vraag ongeveer 2x zo groot is als op de andere werkdagen. Dit zorgt voor problemen.

Ik hoop dat jullie wat ideeŽn hebben over dit probleem.

Met vriendelijke groet,

Bas

Zie bijlageBijlage  site.xls   24,5K   88 maal gedownload

Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

Gesp

    Gesp


  • >250 berichten
  • 339 berichten
  • Ervaren gebruiker

Geplaatst op 26 februari 2009 - 22:58

Waarom zou je een verdeling moeten fitten? Je zou de variabele dag kunnen transformeren in: wel/geen maandag. Voor beide bereken je een parameter; dat verklaart een groot deel van de variantie.
Misschien kan het model verfijnd worden door de andere dagen apart (categoriaal) te fitten; of door te kijken of begin van de periode anders is dan eind van de periode. Maar dat is verfijning.

#3

Caps13

    Caps13


  • >25 berichten
  • 29 berichten
  • Gebruiker

Geplaatst op 26 februari 2009 - 23:54

Hmm, opzich niet gek wat je denkt, maar ik vraag me wel af of er dan nog wel sprake is van een 'model'.

Jij zegt bovendien: Voor beide bereken je een parameter;

De parameter waarvan dan? Of bedoel je gewoon dat je voor bijvoorbeeld die 4 maandagen het gemiddelde gaat uit rekenen? En vervolgens hetzelfde gaat doen voor de niet-maandagen?

Maar zeker bedankt, hebben we tenminste wat aanknopingspunten. We kregen alleen de vraaggegevens, het gedeelte van 'kans' & 'cumulatief' hebben we zelf bedacht. Dus misschien heb je gelijk, en zitten we op het verkeerde spoor.

Zou je nog kunnen verfijnen hoe je die parameters dan zou willen schatten?

Alvast Bedankt!

Bas

#4

Gesp

    Gesp


  • >250 berichten
  • 339 berichten
  • Ervaren gebruiker

Geplaatst op 27 februari 2009 - 08:26

Maak een variabele x, gedefinieerd als x = 0 als maandag, x=1 als andere weekdag
Met regressie kun je een model bedenken, waarmee je de gevonden uitkomsten (vraag naar het product per dag) probeert te voorspellen. Noem de uitkomst van het model y.

De meest simpele regressie is dan:
y = ax +b

De computer berekent een a en een b, waarmee de door het model verklaarde variantie zo groot mogelijk wordt. (Dus waarmee y zo dicht mogelijk in de buurt komt van de data (=vraag naar het product per dag))

#5

Caps13

    Caps13


  • >25 berichten
  • 29 berichten
  • Gebruiker

Geplaatst op 27 februari 2009 - 10:24

Ok, bedankt ik denk dat wij inderdaad te moeilijk dachten.

Er blijft nog wel een resterende vraag over:
-hoe kunnen wij aantonen dat de vraag van dinsdag t/m vrijdag nagenoeg gelijk is?
-hoe kunnen wij aantonen dat de vier weken zich op dezelfde manier gedragen?

Bestaan hier statistische toetsen voor?

#6

Gesp

    Gesp


  • >250 berichten
  • 339 berichten
  • Ervaren gebruiker

Geplaatst op 27 februari 2009 - 11:50

(Disclaimer: ik ben geen statistiek-expert, ik kan er alleen een beetje mee spelen)

Hoe weet je of een extra voorspellende parameter in je model zin heeft?
Door 2 modellen te vergelijken: maakt een extra parameter het model significant beter. De verklaarde variantie wordt altijd beter als je een extra parameter schat, maar is het ook significant. Daar zijn verschillende testen voor, afhankelijk van de exacte methode die je gebruikt. vb F-test, likelihood ratio test.

* Je zou een model met x als categorie met 2 levels (dagen) kunnen vergelijken met x met 5 levels.
* De 1e kolom (dag) zou je kunnen splitsen in w - weeknummer en x - dagnummer (beide als categorie), om vervolgens te kijken of y = ax + cw + b beter is dan y = ax + b.

Je zou met variantie-analyse (analysis-of-variance, ANOVA) een heel eind moeten kunnen komen. Het kan ook met regressie (dat is in dit geval niet wezenlijk anders).





0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures