Discussies doorstroomtoets (5): verschillen tussen toetsaanbieders
Nico den Breejen
Onderwijskundige bij Wij-leren.nl
Geraadpleegd op 20-05-2025,
van https://wij-leren.nl/discussies-doorstroomtoets-deel-5.php
Laatst bewerkt op 23 april 2025

Deel 5: Verschillen tussen toetsaanbieders
Wat zegt de doorstroomtoets over de capaciteiten van leerlingen? Draagt de toets bij aan gelijke kansen, of juist niet? En hoe gaan we om met de spanningen tussen het adviseren van leerlingen en het meten van onderwijskwaliteit? In deze artikelenserie duiken we in de belangrijkste vragen en discussies rond de doorstroomtoets,
Jaarlijks laait de discussie over de verschillen tussen toetsaanbieders weer op, zodra de resultaten van de doorstroomtoets bekend worden gemaakt. Want hoewel alle toetsen hetzelfde doel dienen – het in kaart brengen van de onderwijskwaliteit door middel van de referentieniveaus en het geven van een objectief schooladvies aan leerlingen – blijken de uitkomsten aanzienlijk te verschillen. Dat roept vragen op: Hoe betrouwbaar zijn de uitslagen? Wat betekent dat voor de kansengelijkheid van leerlingen? En: is het nog verantwoord om deze toets zo’n centrale rol te laten spelen in het leven van een kind?
Lees ook de overige delen in deze serie:
- Deel 1: Twee doelen, één toets: de doorstroomtoets zorgt voor uitdagingen
- Deel 2: Overwaardering van een te smalle toets
- Deel 3: Objectieve graadmeter of versterker van ongelijkheid?
- Deel 4: Stigmatisering en prestatiedruk
- Gratis module Wij-leren Academie met infographics
Keuzevrijheid en de gevolgen
Sinds 2015 mogen scholen zelf bepalen welke doorstroomtoets zij afnemen. Deze beleidswijziging moest ruimte geven voor maatwerk: scholen konden zo kiezen voor een toets die past bij hun visie, werkwijze en leerlingenpopulatie. In de praktijk betekende dit ook een flinke toename van het aantal toetsaanbieders.
Die keuzevrijheid heeft echter ook een keerzijde. De verschillen tussen de toetsen zijn dusdanig dat leerlingen met vergelijkbare capaciteiten op de ene toets een ander resultaat kunnen behalen dan op de andere. Dit heeft directe gevolgen voor het schooladvies en daarmee voor de onderwijskansen van kinderen. Een toets zou een zoveel mogelijk objectieve onderbouwing moeten geven voor het advies – maar als de uitkomst mede afhangt van de gekozen aanbieder, komt die objectiviteit onder druk te staan.
“Een leerling kan op de ene toets hoger scoren dan op de andere – puur door het toeval van toetskeuze."
Zes doorstroomtoetsaanbieders
Op dit moment zijn er zes verschillende aanbieders van de doorstroomtoets:
- AMN: AMN-doorstroomtoets: De AMN-doorstroomtoets is volledig digitaal en adaptief. In 2025 is deze toets door 2.539 leerlingen gemaakt.
- Diataal: Dia-doorstroomtoets: De Diataal-doorstroomtoets is volledig digitaal en adaptief. Deze toets is in 2025 door 8.213 leerlingen gemaakt.
- Bureau ICE: IEP-doorstroomtoets: De IEP-doorstroomtoets kan zowel op papier als digitaal adaptief worden afgenomen. In 2025 is deze toets door 67.034 leerlingen gemaakt.
- Cito B.V.: Leerling in beeld-doorstroomtoets: De Leerling in beeld-doorstroomtoets kan digitaal lineair of op papier worden afgenomen. In 2025 is deze toets door 82.529 leerlingen gemaakt.
- A-VISION: Route 8-doorstroomtoets: De Route
- 8-doorstroomtoets is volledig digitaal en adaptief. In 2025 is deze toets door 13.608 leerlingen gemaakt.
- Rijksoverheid: DOE-doorstroomtoets: De DOE-doorstroomtoets kan digitaal adaptief of digitaal lineair worden afgenomen. In 2025 is deze toets door 1.240 leerlingen gemaakt.
“Er zijn zes verschillende toetsaanbieders, elk met eigen keuzes en aanpakken."
Vergelijkbaarheid bevorderen
Om de onderlinge vergelijkbaarheid tussen de zes toetsaanbieders te bevorderen, is een centrale ankerset van kracht. Deze ankerset bestaat uit een reeks gestandaardiseerde toetsopgaven die in alle doorstroomtoetsen terugkomen. Door de prestaties op deze gezamenlijke vragen te vergelijken, ontstaat er een gemeenschappelijk ijkpunt. Zo kan worden bepaald of een toets gemiddeld genomen moeilijker of juist eenvoudiger is dan de andere, en kunnen scoreverschillen tussen leerlingen beter worden geïnterpreteerd.
Deze methode is een belangrijke stap om de onderlinge vergelijkbaarheid van de toetsen te verbeteren – zonder in te grijpen in de autonomie van de aanbieders of de diversiteit aan toetsvormen. Maar lukt het anno 2025 werkelijk om gelijke maat te houden – of blijft de keuze voor een toetsaanbieder bepalend voor de uitkomst?
“Via de ankerset probeert men grip te krijgen op een versnipperd systeem."
Hoe is het gesteld met de vergelijkbaarheid?
De toetsuitslagen van 2025 zijn inmiddels bij alle aanbieders bekend. Laten we eens kijken hoe de uitslagen van de verschillende aanbieders zich per vak tot elkaar verhouden.
Rekenen
In Figuur 1 zijn de behaalde referentieniveaus 1F en 1S voor rekenen weergegeven per aanbieder.
Figuur 1. Percentage leerlingen dat het referentieniveau 1F en 1S voor rekenen behaalde, uitgesplitst naar doorstroomtoetsaanbieder.
Opvallend is dat leerlingen op de toetsen van IEP en Leerling in Beeld (LIB) aanzienlijk vaker het referentieniveau 1F of 1S behalen dan op de toetsen van AMN en Route 8. Dit geldt in het bijzonder voor de papieren afnamevormen. Waar de papieren LIB-toets een opvallend hoog percentage leerlingen laat zien dat de referentieniveaus behaalt – 93,8% voor 1F en 48,5% voor 1S – blijven de scores op de Route 8-toets daar aanzienlijk bij achter: respectievelijk 70,3% voor 1F en 25,3% voor 1S. Het aandeel leerlingen dat het 1S-niveau behaalt op de papieren LIB-toets is daarmee bijna twee keer zo groot als op de Route 8-toets.
“Op de LIB-toets behalen twee keer zoveel leerlingen als op de Route 8-toets het referentieniveau rekenen 1S."
Lezen
In Figuur 2 zijn de behaalde referentieniveaus 1F en 2F voor lezen weergegeven per aanbieder.
Figuur 2. Percentage leerlingen dat het referentieniveau 1F en 2F voor lezen behaalde, uitgesplitst naar doorstroomtoetsaanbieder.
Opvallend is dat vrijwel alle doorstroomtoetsen op het fundamentele niveau 1F consistent boven de 95% scoren, met uitzondering van de AMN- en de Route 8-toets. Bij de AMN-toets haalt slechts 88,5% van de leerlingen het 1F-niveau. Ter vergelijking: bij de papieren LIB-toets is dit 99,2%. Ook op niveau 2F vallen de toetsen van AMN en Route 8 op door lagere resultaten. Zo behaalt bij de Route 8-toets slechts 48,8% van de leerlingen het 2F-niveau, tegenover 79,8% op de papieren LIB-toets.
“Het percentage leerlingen dat het streefniveau voor lezen behaalt, verschilt fors per toetsaanbieder."
Taalverzorging
In Figuur 3 zijn de behaalde referentieniveaus 1F en 2F voor taalverzorging weergegeven per doorstroomtoetsaanbieder.
Figuur 3. Percentage leerlingen dat het referentieniveau 1F en 2F voor taalverzorging behaalde, uitgesplitst naar doorstroomtoetsaanbieder.
Zowel de verschillen bij 1F als bij 2F zijn aanzienlijk. Op de AMN-toets behaalde 79,9% van de leerlingen het 1F-niveau, terwijl dit voor de papieren LIB-toets 97% was. Het 2F-niveau werd op de Route 8-toets door 33,4% van de leerlingen behaald, tegenover 59,2% op de papieren LIB-toets.
“Op de LIB-toets behalen bijna dubbel zoveel leerlingen het 2F-niveau, als op de Route 8-toets."
Alle vakken gemiddeld
In Figuur 4 zijn de behaalde referentieniveaus 1F en 1S/2F voor alle vakken gemiddeld weergegeven per doorstroomtoetsaanbieder.
Figuur 4. Gemiddeld percentage leerlingen dat het referentieniveau 1F en 2F behaalde over alle vakken, uitgesplitst naar doorstroomtoetsaanbieder.
De AMN- en Route 8-toets vallen op met lagere percentages leerlingen die het 1F- en 1S/2F-niveau behalen. De papieren toetsen van LIB en IEP scoren juist opvallend hoog. Het bereik bij 1F loopt van 80,57% tot 96,67%, met een gemiddelde van 93,83% en een standaardafwijking van 4,73 procentpunten. De verschillen tussen de toetsaanbieders zijn bij niveau 1S/2F nog opvallender: Bij de Route 8-toets behaalt 35,83% van de leerlingen dit streefniveau, bij de LIB-toets op papier 62,50%. Het gemiddelde ligt op 55,13%, met een standaardafwijking van 6,13 procentpunten.
“Bij het streefniveau 1S/2F lopen de verschillen op tot 27 procentpunten."
School- en toetsadviezen per doorstroomtoetsaanbieder
Laten we ook eens kijken naar de vergelijkbaarheid tussen de toetsadviezen. In Figuur 5 zijn de adviezen per toetsaanbieder weergegeven.
Figuur 5. Toetsadviezen per doorstroomtoetsaanbieder.
Ook in de verdeling van toetsadviezen zijn grote verschillen zichtbaar tussen de toetsaanbieders. Zo krijgt bij de AMN-doorstroomtoets 14,6% van de leerlingen een pro/vmbo-bb-advies, terwijl dit percentage bij de papieren toets van Leerling in Beeld (LIB) slechts 0,8% bedraagt. Op het niveau gl/havo valt eveneens een duidelijk verschil te zien: 21,3% van de Route 8-leerlingen krijgt dit advies, tegenover 30,8% bij de papieren IEP-toets. Een vwo-advies krijgt 4,4% van de leerlingen bij de AMN-toets, terwijl dit bij de papieren LIB-toets maar liefst 15,4% is.
Deze cijfers maken duidelijk hoe sterk de keuze voor een toetsaanbieder het uiteindelijke schooladvies kan beïnvloeden. Zo kregen:
- leerlingen die de papieren LIB-toets maakten, vier keer vaker een vwo-advies dan de leerlingen die de AMN-toets maakten;
- leerlingen die de AMN-toets maakten, ruim achttien keer vaker een pro/vmbo-bb-advies dan bij de papieren LIB-toets;
- leerlingen die de digitale versie van de LIB-toets maakten, bijna drie keer vaker een pro/vmbo-bb-advies dan bij de papieren LIB-versie.
Deze cijfers maken duidelijk dat de keuze voor een toetsaanbieder niet neutraal is. Een leerling die de papieren toets van LIB maakt, heeft aanzienlijk meer kans op een ‘hoger’ schooladvies dan een leerling die de AMN- of Route 8-toets maakt. Dat roept fundamentele vragen op over de gelijkwaardigheid en rechtvaardigheid van het huidige toetslandschap.
“Leerlingen kregen 18x vaker een pro/vmbo-bb-advies bij de AMN-toets dan bij de papieren LIB-toets"
Zijn de verschillen tussen toetsaanbieders te verklaren door verschillende doelgroepen?
Een veelgehoord tegenargument bij de discussie over verschillen in toetsresultaten tussen toetsaanbieders is dat deze niet voortkomen uit verschillen in toetsinhoud of -moeilijkheid, maar uit verschillen in de leerlingpopulatie. Scholen maken immers zelf een keuze voor een toetsaanbieder en het zou kunnen dat sommige toetsen vaker worden afgenomen op scholen met een andere sociaal-economische samenstelling.
Zo wordt bijvoorbeeld gesuggereerd dat de Route 8-toets relatief vaak wordt gekozen door scholen met een hoger aandeel leerlingen uit gezinnen met een praktischer opleidingsniveau. Als dat zo is, dan is het niet verwonderlijk dat de gemiddelde resultaten op deze toets lager liggen dan bij andere toetsen. Staatssecretaris Paul sloot zich bij deze redenering aan. In een brief aan de Tweede Kamer schreef zij: “Wanneer scholen met een specifiek vaardighedenniveau clusteren bij een bepaalde toets, dan kan dat terug te zien zijn in de resultaten van die doorstroomtoets.”
Maar klopt deze veronderstelling wel? Uit een analyse van de Volkskrant (2025) blijkt dat deze verklaring onvoldoende standhoudt. In die analyse is gekeken naar het percentage leerlingen dat het streefniveau (1S/2F) haalt, afgezet tegen de zogenoemde schoolweging. Die schoolweging neemt de sociaal-economische achtergrond van de leerlingpopulatie mee: hoe hoger de weging, hoe groter het aandeel leerlingen met een migratieachtergrond of praktisch opgeleide ouders. Figuur 6 toont deze gegevens voor het jaar 2024. De gegevens van 2025 zijn op het moment van schrijven nog niet bekend.
“De verklaring dat ‘de doelgroep’ de verschillen veroorzaakt, houdt geen stand."
Figuur 6. Doorstroomtoetsscores niveau 2F in relatie tot de schoolweging. Bron: Volkskrant, 2025.
Wat blijkt? Ook wanneer scholen met een gelijke schoolweging worden vergeleken, blijven er duidelijke verschillen zichtbaar tussen toetsaanbieders. Zo halen scholen met een lage schoolweging op de toets van Leerling in Beeld (de rode stippen in Figuur 6) structureel hogere resultaten dan vergelijkbare scholen die gebruikmaken van de Route 8-toets (de groene stippen in Figuur 6). Voor scholen met een hoge schoolweging geldt exact hetzelfde. Dit ondermijnt het idee dat doelgroepverschillen de uitslagverschillen tussen de toetsaanbieders kunnen verklaren. Wel moet hierbij aangetekend worden dat een schoolweging niet alle doelgroepverschillen kan verklaren. In de praktijk blijkt dat scholen voor speciaal (basis)onderwijs vaker kiezen voor de AMN- en de Route 8-toets. Maar ook binnen de andere toetsaanbieders zijn grote verschillen waarneembaar.
Het is opvallend dat scholen die de Route 8-toets afnemen significant vaker onder de signaleringswaarde scoren dan scholen die kiezen voor de toets van Leerling in Beeld (LIB). Daarmee beperkt de invloed van toetskeuze zich niet tot het schooladvies van individuele leerlingen, maar reikt deze ook tot de beoordeling van de onderwijskwaliteit door de onderwijsinspectie. Met andere woorden: de keuze voor een doorstroomtoets beïnvloedt waarschijnlijk zowel (1) het adviesniveau dat leerlingen krijgen als (2) het inspectieoordeel over de school. Dat maakt de toetskeuze een factor van groot belang in het onderwijsbeleid van basisscholen.
“Zelfs bij vergelijkbare schoolwegingen blijven de verschillen tussen toetsaanbieders zichtbaar."
Conclusie: tijd voor herziening
Het huidige systeem van meerdere doorstroomtoetsaanbieders is niet houdbaar. De cijfers laten zien dat leerlingen zeer verschillende adviezen krijgen, afhankelijk van welke toets zij maken. Daarmee staat de gelijke behandeling van leerlingen onder druk – juist op een moment in hun schoolloopbaan dat bepalend is voor hun verdere ontwikkeling.
Terug naar één centrale doorstroomtoets zou op korte termijn kunnen bijdragen aan meer vergelijkbaarheid en transparantie. Maar dat is niet de oplossing voor het diepere probleem. De fundamentele vraag is: welke rol willen we dat een toets speelt in ons onderwijssysteem?
De doorstroomtoets heeft nu een te grote rol gekregen, zowel in het bepalen van het schooladvies als in het afrekenen van scholen op onderwijskwaliteit. Daarmee wordt voorbijgegaan aan wat een toets wel en vooral niét kan meten. Een enkel testmoment is niet in staat om het volledige beeld van een leerling te vangen – laat staan de kwaliteit van een school.
Wat we nodig hebben, is een systeem waarin de doorstroomtoets slechts één van de bouwstenen is, ingebed in een bredere, meer menselijke en rechtvaardige benadering van schooladvies en onderwijskwaliteit. Een systeem dat ruimte biedt voor groei, context en ontwikkeling. Alleen dan kunnen we écht spreken van eerlijk en betekenisvol onderwijs.
“Zolang toetskeuze het schooladvies beïnvloedt, is gelijke behandeling een illusie."
Referenties
- Meinderstma, B., Frijters, S., & Van den Berg, J. (2025). Het maakt wél uit welke doorstroomtoets een school kiest. De Volkskrant. Geraadpleegd op 16 april 2025, van: https://www.volkskrant.nl/kijkverder/v/2025/doorstroomtoets-school-onderwijsinspectie~v1373080/
- Ooijevaar, M. (2024). Doorstroomtoets: onduidelijkheden, antwoorden, vragen en nog meer vragen. Didactief. Geraadpleegd op 16 april 2025, van: https://didactiefonline.nl/blog/vriend-en-vijand/doorstroomtoets-onduidelijkheden-antwoorden-vragen-en-nog-meer-vragen
- Ooijevaar, M. (2024). Referentieniveaus, doorstroomtoetsen en onderwijsresultaten Artikel 2 van 3: Problemen met de doorstroomtoets. Geraadpleegd op 16 april 2025, van: https://www.linkedin.com/pulse/referentieniveaus-doorstroomtoetsen-en-artikel-2-van-3-ooijevaar-xeoie/?trackingId=9El%2BvfpiReaKFLDazdwcJw%3D%3D