Datadinsdag bij SURF: kickstart jouw data-agenda

Deze datadinsdag stond in het teken van samenwerking en praktische datatoepassingen in het onderwijs — met concrete tools waarmee je in jouw instelling snel aan het werk kunt gaan. Dit keer niet vanuit een mbo-instelling, maar vanuit SURF in Utrecht waar we bij Corneel de Hartogh en Maarten Wagenaar te gast zijn. 

De locatie

Centrum voor Educatieve Data-Analyse (CEDA). CEDA ondersteunt onderwijsinstellingen met datagedreven inzichten. Het centrum richt zich op: 1) samenwerking en standaardisatie: instellingen delen steeds meer uniforme data. 2) Gebruik van AI en machine learning: voor betere voorspellingen en analyses. 3) Digitale autonomie: onderwijsinstellingen moeten niet volledig afhankelijk worden van commerciële partijen zoals Microsoft. Belangrijk uitgangspunt hierbij: CEDA ontwikkelt modulaire tools die makkelijk aan te sluiten zijn op bestaande systemen — instellingen kunnen klein beginnen zonder hun hele infrastructuur te veranderen.

De sprekers

Corneel den Hartogh en Maarten Wagenaar, beiden werkkzaam voor CEDA, JaapJan Vroom (MBO Digitaal en Npuls)

Nieuws en ontwikkelingen

  • CEDA breidt uit: Er komt een groter datateam dat samen met scholen vraagstukken rond onderwijsdata verder ontwikkelt. Binnenkort komen de vacatureteksten online.
  • Einde project Learning Analytics: Het project Learning Analytics van SURF stopt per 1 januari 2026 vanwege beperkte belangstelling en financiering.
  • MBO Digitaal Conferentie oktober 2025: Er was aandacht voor data en bedrijfsvoering, tegelijk bleek dat veel instellingen weinig tot niets doen met learning analytics om leerprocessen en studiesucces te monitoren.

Het verhaal

Tijdens deze Datadinsdag zijn drie concrete projecten uitgelicht die binnen CEDA in samenwerking met verschillende instellingen worden ontwikkeld. Deze projecten laten zien hoe onderwijsinstellingen met relatief eenvoudige middelen en zonder grote technische drempels hun data beter kunnen benutten.

#1 Voortijdig Schoolverlaten (VSV)
Toelichting Corneel den Hartogh

Doel: meer grip krijgen op studentuitval en oorzaken zichtbaar maken | Partners: Yonder, CEDA, DUO.

In dit project is een dashboard ontwikkeld waarmee instellingen direct inzicht krijgen in uitvalpercentages per opleiding of locatie.

  • De tool gebruikt bestaande DUO-gegevens (zoals inschrijvingen, doorstroom en diplomering).
  • Alles is gebouwd met open-source software (R en Python) zodat instellingen het kosteloos kunnen gebruiken en aanpassen.
  • Er is geen programmeerkennis vereist: met een paar eenvoudige handelingen kunnen gebruikers hun eigen data inladen.

De tool geeft:

  • een overzicht van het percentage voortijdig schoolverlaters per opleiding of leerweg;
  • de mogelijkheid om resultaten te vergelijken over jaren;
  • inzicht in trends, bijvoorbeeld stijging of daling van uitval.

Waarde voor instellingen:
Instellingen kunnen met deze informatie gericht beleid maken, bijvoorbeeld extra begeleiding inzetten bij opleidingen waar de uitval toeneemt. Ook kunnen scholen sneller rapportages maken richting bestuur of ministerie zonder afhankelijk te zijn van externe BI-teams.

#2 De Uitnodigingsregel – voorspellend model voor uitval

Doel: vroegtijdig signaleren welke studenten risico lopen om uit te vallen | Ontwikkeld door: Irene Ekkerman (promovendus Vrije Universiteit). Doorontwikkeld in samenwerking met ROC Mondriaan en CEDA.
Deze methode is bij velen al bekend, maar is nu nog makkelijker om in gebruik te nemen. Deze Uitnodigingsregel is een machine-learningmodel dat met historische gegevens voorspelt welke studenten mogelijk voortijdig stoppen. Belangrijke vernieuwing dit jaar is dat het model veel toegankelijker is gemaakt:

  • het wordt geleverd als kant-en-klare installatie, zonder dat gebruikers zelf Python of andere software hoeven te configureren;
  • het systeem bevat meerdere algoritmes en test automatisch welk model het best past bij de eigen data van de instelling;
  • de resultaten worden overzichtelijk gepresenteerd in een lijst of dashboard, met per student een “uitvalkans” (bijvoorbeeld laag, middel, hoog).

Om verantwoord gebruik te stimuleren bevat de tool een stoplichtsysteem:

Groen – de ingevoerde data is voldoende betrouwbaar om het model te gebruiken;
Oranje – de resultaten kunnen indicatief zijn, maar verdere controle is wenselijk;
Rood – te weinig of te onvolledige data, gebruik wordt afgeraden.

Volgende stap:
CEDA onderzoekt hoe instellingen hun eigen datasets kunnen koppelen zonder dat gevoelige persoonsgegevens gedeeld hoeven te worden. Zo kan elke school het model zelfstandig draaien, maar wel profiteren van gezamenlijke kennisontwikkeling.

Bezoekers aan de datadinsdag zijn enthousiast over de verbeteringen:

  • Zij stellen dat dit vraagt om een cultuurverandering: teams moeten leren om data niet alleen achteraf, maar ook proactief te gebruiken om studenten tijdig te helpen.
  • Er is al veel data, maar het is nog versnipperd en wordt handmatig verwerkt. De uitdaging zit in integratie en samenwerking.
  • Er wordt geopperd om het model te koppelen aan het eigen introductieprogramma, om zo te meten welke aanpak daadwerkelijk helpt om studenten vast te houden.

#3 Instroomprognoses

Doel: vroegtijdig voorspellen hoeveel studenten zich per opleiding of domein zullen inschrijven, zodat beter gepland kan worden | Partners: Radboud Universiteit, CEDA, diverse mbo-instellingen. Instellingen willen steeds eerder weten hoeveel studenten er volgend schooljaar komen, om tijdig te kunnen plannen voor personeel, lokalen en materialen. Daarom ontwikkelt CEDA voorspellende modellen die gebruikmaken van:

  • centrale aanmelddata (Cambo-bestanden);
  • historische trends in instroom per opleiding;
  • en aanvullende variabelen zoals regio, profiel en opleidingstype.

De modellen worden eerst getest met hogeschooldata van de Radboud Universiteit en daarna aangepast voor het mbo. Een voorbeeld laat zien dat de voorspellingen al vanaf januari/februari een betrouwbaar beeld kunnen geven van de instroom in september. Tijdens de sessie werd ook besproken dat deze analyse helpt om de gevolgen van demografische krimp tijdig te signaleren. Sommige instellingen zien een daling in aanmeldingen, andere juist groei; met deze data kunnen ze scenario’s vergelijken en beleid voorbereiden.

Toekomst en samenwerking
Kernpunten voor de komende periode:

  • Verdere ontwikkeling van instroom- en uitvalvoorspellingsmodellen.
  • Nieuwe vacatures binnen CEDA voor uitbreiding van het datateam.
  • Meer samenwerking tussen mbo, hbo en vo rond datastandaarden en kennisdeling.
  • Uitbreiding van minimum viable products (kleine, direct bruikbare tools).

Regiobijeenkomsten datacoalitie mbo en CEDA
Toelichting door Maarten Wagenaar

Er worden vijf regiobijeenkomsten georganiseerd om van instellingen te horen:

  • Welke datavraagstukken leven er?
  • Waar is behoefte aan (inzichten, tools, thema’s)?
  • Welke successen of knelpunten spelen er lokaal?

De uitkomsten helpen om nieuwe projecten te prioriteren. Aanmelden kan via het Npuls community platform AI en Data

AI & Data Innovatiestarter
Toelichting door JaapJan Vroom

Binnen het Npuls AI en Data communityplatform is nu een Innovatiestarter beschikbaar: en overzicht van concrete AI- en dataprojecten in het onderwijs.

Doel:

  • Kennis delen over lopende experimenten.
  • Scholen koppelen die met vergelijkbare onderwerpen bezig zijn.
  • Samenwerkingen stimuleren.

Iedereen kan zelf projecten toevoegen of contact opnemen met de regionale community managers om mee te doen.

Reacties (0)
Geef een reactie