Op 31 december zaten we met enkele Koherianen opnieuw gekluisterd aan onze radio. Zouden we erin geslaagd zijn het voorspellingsmodel zodanig aan te passen dat we De Tijdloze Top 100 van Studio Brussel juist hadden? Of toch beter dan vorig jaar? Je leest het hieronder!
Langer wachten op een voltreffer
Dit jaar moesten we wat langer luisteren om onze eerste voltreffer te horen. Op nummer 87 was het zover! Een perfecte voorspelling over de plaats van U2 met With or Without You. Voor de rest van de lijst gelde ook dit jaar opnieuw hetzelfde verhaal: hoe dichter bij de top 10, hoe beter de voorspelling. Acht van de tien nummers uit de top 10 hadden we juist. Vijf daarvan zelfs op de correcte plaats.
ARIMA, Python, AIC en SARIMA
De voorspelling van De Tijdloze kan gezien worden als een predictie over een tijdseenheid heen – namelijke editie. Aan de hand van het Autoregressive integrated moving average- of ARIMA-model werd hiervoor een Python-script uitgewerkt. Een van de verbeteringen ten opzichte van ons vorig model brachten we aan op vlak van de minimum Akaike Information Criteria (AIC). Die berekenden we nu per lied in plaats van één optimale AIC voor het ganse model. Op basis van die individuele AIC-waardes, trainden we het model.
Verder bleek dat de seizoensvariatie die toegevoegd kan worden (SARIMA) geen betere predictie opleverde waardoor de seizoensparameter dit jaar niet meer in het model werd opgenomen.
Onvoldoende data
De grootste zwakte van onze voorspelling zat hem ongetwijfeld in onze brondata. Die bestond namelijk uitsluitend uit de historische resultaten van De Tijdloze. Daardoor verloren we niet alleen de mogelijkheid om nieuwe nummers te voorspellen, maar moesten we ook nummers laten vallen die nog geen 5 keer voorgekomen waren. Het ARIMA-model wordt namelijk steeds zwakker naarmate er minder historische datapunten zijn.
Een ander probleem dat we opmerkten bij onze voorspelling is dat we nummers die per uitzondering vorig jaar niet voorkwamen, maar ondertussen wel een gevestigde waarde aan het worden waren, heel slecht voorspeld werden door ons. Dit is een belangrijk inzicht om mee te nemen naar volgende pogingen. Het duidt immers op één van de zwaktes van het model.
Op naar volgend jaar
De beste manier om onze voorspelling te verbeteren is natuurlijk gewoon volgend jaar opnieuw proberen! Met een extra jaar aan data en vooral een extra jaar aan ervaring, proberen we zo weer een stapje dichter te komen bij de perfecte voorspelling!
Top 10 realiteit versus voorspelling
Plaats | Realiteit | Voorspelling |
1 | Pearl Jam – Black | Pearl Jam – Black |
2 | Fleetwood Mac – The Chain | Nirvana – Smells Like Teen Spirit |
3 | Queen – Bohemian Rhapsody | Queen – Bohemian Rhapsody |
4 | Gorky – Mia | Gorky – Mia |
5 | Pink Floyd – Wish You Were Here | Pink Floyd – Wish You Were Here |
6 | Eddie Vedder – Society | Lou Reed – Walk on the Wild Side |
7 | Dire Straits – Sultans of Swing | Metallica – One |
8 | Nirvana – Smells Like Teen Spirit | Led Zeppelin – Stairway to Heaven |
9 | Pink Floyd – Shine On You Crazy Diamond | Pink Floyd – Shine On You Crazy Diamond |
10 | The Cure – A Forest | Dire Straits – Sultans of Swing |