COVID-19 hackathon voor Datatrainees: 'verkennende data-analyses als mooie opzet'

In juni 2020 organiseerde Universiteit Utrecht een online hackathon voor de Datatrainees van het Rijks I-Traineeship. Verspreid over meerdere sessies en ingedeeld in zeven teams werkten de trainees aan een maatschappelijk of economisch vraagstuk, gebruikmakend van data en data-analysetechnieken. De rode draad van de hackathon was COVID-19 en de effecten op de Nederlandse samenleving.

Tijdens de hackathon kregen de teams ondersteuning van datascience-experts van de Universiteit Utrecht. Een van hen was Arjan Egges, docent bij de Universiteit Utrecht binnen het departement Informatica, tevens begeleider van de leergang datascience binnen het Rijks I-Traineeship. Arjan: 'Door de coronacrisis konden we het originele idee van een hackathon, op een kluitje zitten en veel doen in een korte periode, niet uitvoeren. Daarom besloten we de hackathon online te organiseren, uit te spreiden over meerdere sessies en als casus COVID-19 te nemen. De Datatrainees gingen in zeven teams aan de slag met zelfgekozen beleidsvragen met betrekking op corona en de Nederlandse samenleving.'

Verschillende datavraagstukken

Arjan: 'De Datatrainees hebben gekeken naar verschillende aspecten variƫrend van het onderzoek van het effect van COVID-19 op de scheepvaart of de beurskoersen, het onderscheiden van de maatregelen die veel hebben bijgedragen aan het verbeteren van de luchtkwaliteit, en het onderzoeken van trends op Google en Twitter om een beeld te krijgen van het welzijn van de Nederlandse bevolking de afgelopen maanden.' Om de benodigde data te verzamelen, zijn de trainees zelf met stakeholders in gesprek gegaan of op zoek gegaan naar data, om dit vervolgens te analyseren. 'Hierbij volgden de trainees CRISP-DM, een standaardproces voor het beantwoorden van datasciencevraagstukken. De kennis die zij tijdens het traineeship hebben opgedaan op het gebied van statistiek, machine learning, en hoe om te gaan met missende data, kwam bovendien goed van pas', vertelt Arjan.

Covid 19 Hachathon combinatie beurs en lockdown index NL 770

Effect op de scheepsvaart

Datatrainee Suzanne ten Oever deed met haar team onderzoek naar het effect van COVID-19 op de scheepsvaart. Ze vertelt: 'Via mijn huidige opdracht bij de Inspectie Leefomgeving en Transport (ILT) hebben wij een stakeholder gevonden die ons kon voorzien in een dataset die scheepslocaties in Nederland laat zien. We hebben geanalyseerd hoeveel schepen er in de ankervakken liggen, dit zijn soort parkeerplaatsen voor schepen, en gekeken of de hoeveelheid schepen is toegenomen in coronatijd. En inderdaad, er leek een effect te zijn: we ontdekten een toename in het aantal schepen die in ankervakken lagen, omdat sommige schepen wellicht hun lading niet konden lossen. Erg interessant dus! Hoewel dit onderzoek bedoeld is als verkenning, hebben we wel een mooie opzet kunnen geven voor ILT en laten zien dat we in een korte periode mooie dingen kunnen doen met data. Ik vond het enorm leuk en uitdagend om te doen en vernieuwend om even met iets anders bezig te zijn dan mijn traineeopdracht.'

Voortgang en feedback

Wekelijks vond er via Microsoft Teams een voortgangsronde plaats met alle Datatrainees. Iedere groep vertelde waarmee ze bezig waren en hierop konden de andere groepen reageren en feedback krijgen van de begeleiders vanuit Universiteit Utrecht. Suzanne: 'Met mijn eigen groep verliep het contact via Webex-meetings. Hier bespraken we ieders taken en knelpunten, maar konden we ook sparren. Ook kregen we wekelijks feedback van de begeleiders vanuit de universiteit. Als we even vastliepen, waren zij altijd heel bereid om te helpen.' Naast de begeleiding vanuit de Universiteit Utrecht kregen de trainees feedback van Vera Timmermans, Chief Medical Information Officer bij het ministerie van Volksgezondheid, Welzijn en Sport. Vanuit haar inhoudelijke deskundigheid over het thema COVID-19 gaf zij de trainees wat praktische tips en waar nodig een duwtje in de goede richting.

'De trainees hebben bewezen in korte tijd het CRISP-DM proces te kunnen doorlopen en zijn in staat iets interessants uit de data te halen'

'Iets interessant uit data halen'

Op 26 juni was de afsluitende Digital Summit, waarin elk team online een presentatie gaf over hun onderzoek, waarna er ruimte was voor vragen en discussie. Arjan blikt terug: 'Ik vond het heel leuk om te zien hoe zelfstandig ze werkten aan de gekozen vraagstukken. Iedere groep kwam met verschillende vragen. Er was weinig tijd om heel veel te doen, maar de analyses en resultaten die de groepen hebben opgebracht zijn erg goed. Ze hebben bewezen in een korte tijd het CRISP-DM proces te kunnen doorlopen en zijn in staat iets interessants uit de data te halen. Ook hebben ze laten zien dat er nog heel veel data is over COVID-19. Als je echt gedegen, uitvoerige analyses doet, levert dit vast heel nuttige informatie op.'