Recent was ik als tweede beoordelaar aanwezig bij de presentatie van een econometriestudent over zijn afstudeeronderzoek. Voor een bedrijf in de halfgeleiderindustrie heeft hij bekeken of je beter de vraag kunt voorspellen door gebruik te maken van zogenaamde ‘machine learning’-technieken. Dat zijn slimme wiskundige algoritmes die door de beschikbare historische vraagdata heen ploegen (data mining) om tot de beste voorspellingen voor de toekomstige vraag te komen. Zijn hoofdconclusie is dat dit op zich redelijk werkt, maar ook dat in de meeste gevallen een eenvoudig gemiddelde van de meest recente vraagobservaties een nog beter voorspelling oplevert.
Mij verbaasd dat niets. Een nadeel van alle data mining methoden is namelijk dat er erg veel data nodig is om ze te ‘trainen’. Het principe is namelijk dat je niet uit gaat van een bepaalde logica, zoals dat vragen uit het recente verleden wel indicatief zijn voor de nabije toekomst en bijvoorbeeld een gemiddelde van zeg de laatste 10 observaties logisch is. In plaats daarvan gaan data mining methoden min of meer in het wilde weg zoeken naar allerlei verbanden, die ze dan weer samenvoegen om tot betere voorspellingen te komen. Tien observaties is dan veel te weinig. Het eerdergenoemde bedrijf beschikte over een kleine honderd observaties van de maandelijks vraag over de afgelopen 7 jaar, en dat voor negen typen machines. Bijna duizend observaties in totaal dus, maar klaarblijkelijk nog steeds niet genoeg.
Sociale media en productintroducties
De meest succesvolle studies gaan uit van nog veel meer data, vaak beschikbaar via sociale media. Recent woonde ik een wetenschappelijke presentatie bij over een studie waarin men probeerde op basis van film reviews in te schatten hoeveel publiek een nieuwe film trekt. Dan zijn er vele duizenden of zelfs miljoenen data punten om slimme algoritmes mee te trainen, en het leverde ook vrij accurate voorspellingen op. Bovendien gebeurde dit voordat een film in de bioscoop verscheen, waarmee het directe gebruik van simpele methoden lastig was.
Ook binnen voorraadbeheer is data mining het meest veelbelovend in situaties waarbij enerzijds niet of nauwelijks vraagdata voorhanden zijn en anderzijds veel relevante ‘product review’ data beschikbaar zijn. In eerste instantie denk ik dan aan de introductie van nieuwe producten op de markt, waarbij op basis van reacties op de marketing voorspeld kan worden in welke mate een product al dan niet aan zal slaan.
Na een aantal weken van verkoop is het nog steeds verstandig om de initiële voorspelling mogelijk bij te stellen op basis van de reguliere forecastmethoden, of zelfs volledig over te gaan op deze traditionele methoden. Dit kan tot meer accurate voorspellingen leiden en tevens inzicht verschaffen in hoe de vraag zich ontwikkeld. Standaard voorspelmethoden kunnen bijvoorbeeld aangeven of er al dan niet significante trend- of seizoensinvloeden zijn. Een data mining methode verschaft die inzichten niet, want het blijft een ‘black box’ waar je heel veel data in stopt en er vervolgens voorspellingen uit krijgt. Dat gebrek aan inzicht kan ook het vertrouwen van managers in een voorspelling verminderen, en daarmee in het gebruik er van.
Big data bij voorraadbeheer, ik heb mijn twijfels
Sommige van mijn collega’s denken dat dit nadeel van data mining in de toekomst minder prominent zal zijn, omdat nieuwe generaties er steeds vertrouwder mee zullen raken en bijvoorbeeld robotisering ook breder in de maatschappij toegepast zal worden. Ik heb daar mijn twijfels over en denk dat eenvoudig te begrijpen methoden die simpele inzichten verschaffen in veel gevallen de voorkeur zullen blijven houden.
Kortom, big data en data mining kunnen zeker een toegevoegde waarde bieden binnen voorraadbeheer, met name daar waar het gaat om productintroducties. Echter, het is zeker ook een hype en in veel situaties verdienen simpele, bestaande statistische methoden de voorkeur. Hoe dan ook doet elk bedrijf er goed aan om exacte methoden te gebruiken voor het voorspellen van de vraag en beheren van voorraden. Indien u miljoenen artikelen op voorraad hebt, overweeg dan zeker om een expert aan te trekken, waarbij een econometrist voor de hand ligt.
Vragen of suggesties
Heeft u vragen of suggesties voor Ruud Teunter? Wilt u meer weten over het afstudeeronderzoek waar in de blog aan wordt gerefereerd? Stuur een mail naar Harm Beerens, content & community manager van het IMCC: h.beerens@imcc.nl
Login om te reageren op dit artikel