Waar ligt de cesuur?

Karen Heij

Zelfstandig toetsexpert bij Parrhesia onderwijsadvies

Geplaatst op 4 oktober 2016

Vier experts over de grens tussen voldoende en onvoldoende

Een 5,5 is een voldoende. In het onderwijs hanteren we al sinds jaar en dag deze grens tussen onvoldoende en voldoende, in vaktermen: de cesuur.

Is dat gewoon een kwestie van afspraak of zit er een logica achter dit getal? Het voelt vreemd om een rekentoets te krijgen waarbij een 4,5 al voldoende is.

Komt dat omdat we gewoontedieren zijn of is er meer aan de hand?
Hoe komen cijferbepalingen tot stand en wat zijn de overwegingen?

Theo Eggen is hoogleraar aan de Universiteit Twente, verbonden aan Cito en het Research Center voor Examinering en Certificering (RCEC).

Bernard Veldkamp is hoogleraar aan de Universiteit Twente en tevens verbonden aan RCEC.

John de Jong is hoogleraar Taaltoetsing aan de VU.

Tjeerd Haitjema is psychometrisch expert bij Bureau ICE.

Met deze experts heeft Toets! op verschillende momenten gesproken, waarbij ieder gesprek zijn eigen verloop kende. In dit artikel vatten we hun inzichten en antwoorden samen.

Wat is eigenlijk een cesuur?

Theo Eggen: ‘Een cesuur is een standaard. Een cesuur is altijd gekoppeld aan een besluit. Boven de grens neem je een ander besluit dan onder de grens: voldoende of onvoldoende, geslaagd of niet geslaagd, toegelaten of afgewezen. De eindtoets voor het basisonderwijs, zoals Cito die maakt, heeft eigenlijk vier cesuren; vier blokjes waar vier verschillende besluiten bij horen. Er zijn overigens ook toetsen waarbij zo’n besluit niet aan de orde is. Bijvoorbeeld bij het meten van vooruitgang. Dan is er helemaal geen cesuur nodig.’

Zit er een logica achter de 5,5 als voldoende?

'Zeker’, zegt De Jong. ‘Een 5,5 staat voor een score die hoortbij iemand die ten minste 50% van het getoetste niveau, en wat daarin beschreven staat, goed doet. Onder de 5,5 zitten scoorders bij wie de kans groter is dat ze het niveau niet beheersen. De score 5,5 (en hoger) wordt toegekend aan de groep mensen bij wie de kans groter is dat ze het wel kunnen dan dat ze het niet kunnen.

En in deze groep zal je niemand meer tegenkomen waarbij de kans groter is dat hij het niet kan dan dat hij het wel kan. Dat is de definitie van het Raschmodel. In feite doen we nogal ingewikkeld met deze psychometrische onderbouwing. Iedere docent weet dat de grens ongeveer op de helft ligt, een 5 is onvoldoende en een 6 is net voldoende.

"Niemand haalt het in zijn hoofd om te zeggen dat een 1 voldoende is"

Net zomin als dat je minstens een 9 moet halen om te slagen. Dat bestaat niet.’

We krijgen een rekentoets, waarbij een 4,5 voldoende is. Is dat een goede ontwikkeling?

Daar is De Jong heel kort over: ‘Ze zijn gek.’

Haitjema vult aan: ‘Het lijkt me een halfslachtige erkenning op de inhoudelijke kritiek uit het veld. Maar het is bizar om dan de cesuur te verlagen. Óf je weerlegt de kritiek, óf je besluit dat 2F nog te hoog gegrepen is en je verlegt je ambitie. Maar dat doe je niet door de cesuur te verlagen. Beter is om dan te besluiten, tijdelijk, op een niveau lager, 1F, te toetsen.’

Eggen ziet dat anders. 'Het vasthouden aan de cijferschaal is misschien onzin. Maar als je dat doet kan in het begin een 4,5 wel acceptabel zijn. Tijdelijk. Als je maar toewerkt naar een 5,5 als grens.'

Veldkamp onderschrijft de tijdelijkheid van die aanpassing: ‘Bij de invoering van de rekentoets is geadviseerd om de cesuur bewust lager te leggen omdat de meeste examenkandidaten voor rekenen nog niet op de referentieniveaus van Meijerink zitten. Door de lat eerst laag te leggen en hem vervolgens in een paar jaar tijd stapsgewijs te verhogen tot de referentieniveaus, geef je het vo en het mbo de tijd om het rekenonderwijs op een verantwoorde manier in te voeren, zodat je van examenkandidaten ook kunt verwachten dat ze de rekentoets halen.’

Wat heb je nodig om te kunnen vaststellen of iemand iets voldoende beheerst?

De Jong: ‘Je hebt eerst een beschrijvingskader nodig van wat mensen moeten kunnen doen en hoe goed ze dat moeten kunnen doen. Zo’n beschrijvingskader beschrijft ook hoe iemand zich ontwikkelt van nagenoeg geen beheersing naar praktisch volledige beheersing. Vervolgens zoek je naar een punt waar de kans groter is dat iemand het wel kan dan dat hij het niet kan. Dat is het basisprincipe.

"Je hoeft geen 5 sterren te hebben om een restaurant te beginnen"

Neem het examen van een bakkersopleiding. Als iemand goed deeg kan rollen is dat niet voldoende om te slagen. Maar hij hoeft ook niet alle finesses te beheersen, want dan hebben we geen bakkers meer in Nederland. Je hoeft geen 5 sterren te hebben om een restaurant te beginnen.

Je vraagt dus nooit het maximum, maar ook nooit het minimum: je zit er altijd ergens tussenin. Wanneer weet je meer wel dan niet? Dat zal je met elkaar moeten bepalen. Internationale onderzoeken laten zien dat het heel belangrijk is voor een hoge onderwijsopbrengst dat alle betrokkenen heel duidelijk weten wat de bedoeling is van het onderwijs, wat de standaarden zijn en wat de inhoud van het onderwijs zou moeten zijn.’

Omdat veel leerlingen in de basisberoepsgerichte leerweg moeite hebben om rekenniveau 2F te behalen, komt er een eenvoudigere variant. Wel krijgen de vmbo-bb-leerlingen vanaf 2015-2016 vier kansen. Tegelijkertijd wordt er gestart met een pilot met een rekentoets 2A, de eenvoudigere rekentoets voor vmbo-bb. Maar er is geen inhoudelijke beschrijving van 2A.

Is dit wenselijk?

Veldkamp: ‘Ik ben heel blij met die eenvoudige variant. Als je naar de toetsresultaten van vmbo-bb-leerlingen kijkt en in gesprek gaat met het veld, dan moet je constateren dat 2F voor veel van hen onhaalbaar is en je kunt je afvragen of zij dat niveau echt nodig hebben in hun werk.’

Maar Haitjema is geen voorstander: ‘Niet wenselijk, zo wordt de inhoud van een nog onbekende toets leidend voor de invulling van een niveau. Er is nu nergens een inhoudelijke beschrijving van 2A, dus docenten, leerlingen en andere betrokkenen in het onderwijs weten niet waar ze zich op moeten voorbereiden.

"Het is bijna onethisch: pas indien noodzakelijk de didactiek aan!"

Het is bijna onethisch. Breng eerst maar in kaart waar leerlingen precies moeite mee hebben, bespreek wat wenselijk is wat ze wel moeten beheersen, pas indien noodzakelijk de didactiek daarop aan, maak een inhoudelijke beschrijving en maak die openbaar. Daarna pas komt toetsconstructie om de hoek kijken. Een goede toets moet gebaseerd zijn op een duidelijk inhoudelijk kader. Pas dan kun je met elkaar controleren of het examen goed is en een daarbij passende cesuur opstellen.’

Ook De Jong vindt dit een verkeerde ontwikkeling: ‘Zelfs daar waar we syllabussen hebben, hebben we nog te weinig houvast. Laat staan dat we in een syllabus opschrijven wat er in het examen zit. Omgekeerde wereld. Omdat het niet bekend is wat we eigenlijk willen meten, zijn de vo-examens nu al niet zomaar een goede vertaling van wat we willen dat mensen kunnen.’

Samen bepaal je dus de inhoud. Dan vaninhoud naar uitslag: hoe stel je een cesuur op?

Eggen: ‘Heb je nog weinig data, dan werkt men het meest met de standaardbepalingsmethode Angoff. Je neemt meerdere experts, minstens 8 om een goede steekproef te hebben, en het gezamenlijk oordeel van de experts geeft je de cesuur. Je laat hen een student in gedachten nemen die op de grens van voldoende/onvoldoende zit.

Vervolgens laat je hen per item aangeven of ze denken dat ‘hun’ grensstudent deze wel of niet goed zal maken. Je verzamelt alle oordelen en middelt ze, of sluit de uitersten uit. Belangrijk bij deze methode is dat de experts zeer vertrouwd zijn met de inhoud van wat er getoetst moet worden en met de toets zelf. Laat de experts ook eerst met elkaar discussiëren over de vragen voordat zij hun inschattingen met betrekking tot de ‘grensstudent’ geven.

Bekend is dat veel beoordelaars de grensstudent overschatten. Zeker bij innovaties, nieuwe toetsen, denken beoordelaars dat leerlingen meer goed zouden moeten doen dan ze in de praktijk blijken te kunnen. Op basis van de expertoordelen kun je besluiten om de cesuur, de 5,5, op een bepaalde plek te leggen.

Vervolgens is het wijs om ook even af te wegen wat de gevolgen zijn van de cesuur op deze plek: hoeveel studenten zullen er nu zakken en slagen? Hierover kun je in een nieuwe ronde met de experts opnieuw nadenken. Deze methode werkt goed en is redelijk uitvoerbaar. Je zorgt zo tegelijkertijd voor draagvlak.

"De rekentoets: het niveau gaat niet omhoog omdat je een toets afneemt"

Ongeveer zo is het ook gegaan bij de rekentoets. Je ziet dan dat de vakdeskundigen de cesuur hoog leggen en dat de resultaten in de praktijk anders uitwijzen. De gedachte was dat het rekenniveau omhoog zou gaan. Maar het niveau gaat niet omhoog omdat je een toets afneemt. Daar is meer voor nodig.’

Soms sturen we aan op een bepaald slagingspercentage. Hoe doe je dat dan met een cesuur?

Eggen: ‘Bij een goed beschreven inhoudelijk kader werkt zo’n Angoff-procedure best redelijk. Maar je kunt ook een combinatie maken met een variant van de Hofsteemethode. Neem de kennisbasistoets bij de lerarenopleidingen van de hogescholen. Daar stellen we een cesuur vast, maar combineren dat met de mogelijkheid om te schuiven (Hofstee).

Je vraagt je dan af: wat is het minimale en maximale aanvaardbare percentage personen dat kan slagen? En wat is het minimale en maximale percentage kennis dat iemand moet hebben om te slagen? Bijvoorbeeld: je moet minimaal 40% van de voorgeschreven kennis hebben en je mag nooit meer dan 80% van de kandidaten laten zakken. Een soort compromismethode, feitelijk twee schuiven waar je mee mengt tot je tot een aanvaardbare cesuur komt.’

Waarom zijn de slagingspercentages van de verschillende vakken niet hetzelfde?

Eggen: ‘Verschillende deskundigenpanels voor de verschillende vakken kunnen via de Angoff-procedure uitkomen op verschillende cesuren.

Weet je wat dwaas is? We slagen er eindelijk in om meer leerlingen een exact vakkenpakket te laten kiezen. Het is al jaren zo dat van de vwo’ers bijna de helft het vak wiskunde B kiest. Iedereen doet examen Nederlands. En de slagingspercentages voor wiskunde zijn bijna altijd een procent of 10 lager dan die voor Nederlands, ondanks dat wiskunde maar door een geselecteerde groep is gemaakt.

"Zo zie je hoe vreemd we soms bezig kunnen zijn"

Dit zal met de status van het vak wiskunde te maken hebben: het is moeilijk, en dus vinden wij lagere slagingspercentages aanvaardbaar. Zo zie je hoe vreemd we soms bezig kunnen zijn. Dan hebben we eindelijk meer leerlingen, maar dan laten we ze zakken en demotiveren hen op deze manier om verder exact te kiezen.’

Dus hoe groot de inspanning ook zou zijn van leerlingen, leraren, lesmethodes, uren, enzovoort, je zal dat niet terugzien in de examenresultaten?

Eggen: ‘Nee, en dat zou natuurlijk wel moeten. Ik denk wel dat deskundigen hier op de langere termijn een halt aan moeten toeroepen, maar vooralsnog is het zo.’

Eerder werd gesproken over een goed inhoudelijk kader. Welke basis bieden de referentieniveaus voor bijvoorbeeld de rekentoetsen?

Eggen: ‘Dat vind ik heel lastig. Want men zegt wel dat je opgaven op een bepaald niveau hebt, maar wat betekent dat eigenlijk? Wat zegt je dat dan? Maakt iemand met dat niveau die opgave goed of heeft diegene een kans van 50% of meer om dat item goed te maken? Dat weet men eigenlijk niet zo goed.

De items van een niveau zijn echt niet altijd even moeilijk. Er zitten opgaven bij waarvan je verwacht dat iemand die precies op dat niveau zit ze niet goed zal maken, en dat iemand die hoger dan die cesuur zit, ze wel goed zal maken.

Kortom, die niveaus worden vertaald in opgaven die zelf variëren in moeilijkheidsgraad, maar die als het goed is wel beperkt zijn in spreiding. Dus het is niet zo maar klip en klaar bij welk niveau een item hoort, of hoe moeilijk een niveau is.’

En hoe sturend is het Common European Framework voor het maken van toetsen voor de moderne vreemde talen?

De Jong: ‘Brian North heeft ooit de descriptoren (beschrijvingen van taaltaken, red.) voor niveaus van taalvaardigheid over de hele wereld onderzocht en verzameld. In Europa is dat opgepakt in de vorm van een Europees Referentiekader. Dat kader is gebaseerd op 500 losse descriptoren. Die zijn als losse statements geschaald, dat wil zeggen: ieder statement (‘kan de krant lezen’, ‘kan uitleggen waarom hij te laat is gekomen’) is geschaald van ‘kan helemaal niks’ tot ‘kan praktisch alles’.

Inschaling: 'kan helemaal niks’ tot ‘kan praktisch alles’

Die schaal is vervolgens ingedeeld in intervallen omdat het als geheel onbeheersbaar was. Die zijn gedefinieerd als A1, A2 etc. En wat is de grens tussen A1 en A2? Dan kom je weer op het verhaal van de cesuur. Wanneer beheers je A2? Toen ze de schaal maakten hebben ze de descriptoren ingedeeld. De descriptoren in het interval A1 hoorden bij A1 en de descriptoren daarboven, in het interval A2, hoorden bij A2.

Vervolgens heeft men die descriptoren samengevat en dat zijn de globale niveaubeschrijvingen geworden. Nu komt de vraag: waar moet je zitten als gebruiker van de taal om A1 te zijn? Brian North en Cambridge zeggen dat je aan het begin van interval A1 moet zitten. Maar dat is onzin. Dat is zeggen dat iemand zijn gymnasiumdiploma heeft gehaald als hij maar één vraag van het examen goed heeft. De makkelijkste vraag nog wel.

Het lijkt me toch dat iemand die A1 ‘is’ in de meeste gevallen de zaken die worden beschreven binnen dit interval moet beheersen. Vervolgens zit je met de vraag: wat is de definitie van ‘in de meeste gevallen’? De globale descriptor van A1 is eigenlijk een samenvatting van alle losse A1-descriptoren. Maar lees alle documenten van de Raad van Europa en lees ook de nageboortes daarvan en nergens, maar dan ook nergens, lees je over hoe je dat moet interpreteren.

Er wordt aangenomen dat mensen weten wat A1 is. Er wordt aangenomen dat als je een examen of een toets wilt afleveren op niveau A1, dat je wel weet wat A1 is. Maar er is geen psychometrische definitie. Het is en blijft een inhoudelijke beschrijving. En zo behoud je het misverstand dat wat Cambridge als A1 aanmerkt, in feite veel lager is dan wat wij hier als A1 bestempelen.’

Bureau ICE maakt tal van toetsen gebaseerd op het Europees Referentiekader. Hoe doen jullie dat? Waar leggen jullie de cesuur?

Haitjema: ‘We maken taken die iemand met een bepaald niveau in principe allemaal goed zou moeten maken. Ook de ‘6min’-kandidaat. Maar een cesuur van 100% is natuurlijk niet wenselijk of verdedigbaar. Bij veel toetsen houden we een ‘ruis’ aan van 20%: kandidaten kunnen vragen verkeerd interpreteren, en constructeurs kunnen er ook naast zitten.

De cesuur ligt dan in principe op 80%. Van toetsen die bijvoorbeeld in ons digitale toetssysteem TOA zitten, kunnen we anoniem data verzamelen en analyseren. Omdat in de TOA ook toetsen zitten die twee niveaus meten en omdat we werken met zogenaamde ankeropgaven die terugkomen in verschillende toetsen, kunnen we één lange vaardigheidsschaal maken, van A1 tot of tot en met – C1.

Daarnaast werken we ook met standaardsettingsprocedures (zoals een Angoff-procedure, red.), waarbij externe inhoudsdeskundigen een oordeel over elke individuele vraag formuleren. Op grond van de vaardigheidsschaal en de uitkomsten van de standaardsettingsprocedure wordt de cesuur gemonitord en worden cesuren desgewenst aangepast, of toetsopgaven vervangen’.

Niet bij elke soort toets is een cesuur van groot belang, toch?

Veldkamp: ‘Nee. Bij toetsen die erop zijn gericht om leerlingen verder te helpen, formatieve toetsen, gaat het veel meer om de informatie die je uit die toetsen krijgt. Je kunt je afvragen hoe belangrijk het is dat je bij dit soort toetsen een cesuur bepaalt. Toetsen zijn nu vaak een stok achter de deur en dat is jammer. Het streven naar een zes gemiddeld is een probleem.

Internationaal zie je dat we heel goed in staat zijn onze leerlingen naar een zes te brengen, maar we zijn niet goed in staat om ze te laten excelleren. Daarvoor zijn we te veel ingesteld op het behalen van de minimale basis. In de praktijk zie je vaak dat elke toets na een lesstofeenheid de functie heeft van een examen.

Het levert een gemiddelde op dat boven de zes moet zijn. Dat is een heel summatieve manier van omgaan met toetsen. De kwaliteit van het onderwijs zou veel beter worden als we meer formatief zouden toetsen en als we de informatie die zo’n toets kan opleveren beter zouden gebruiken.’

Meer feedback geven, bijvoorbeeld? Als feedback geven een belangrijk doel is, wat voor toets heb je dan eigenlijk nodig?

Veldkamp: ‘Feedback geven is belangrijk en een uitdaging op zich. Het vraagt in mijn beleving ook om andere toetsen. Feedback wordt gerichter als je meer formatieve toetsen gebruikt, die veel dichterbij de methode liggen. Het betekent dus dat je als school altijd goed moet nadenken welke informatie je wilt verkrijgen uit een toets. Wil je leerlingen kunnen vergelijken met landelijk gemiddelden? Dan heb je leerstofonafhankelijke toetsen nodig.

Die lenen zich weer minder voor opbrengstgericht werken. Bij opbrengstgericht werken is het immers de uitdaging om de toetsresultaten te interpreteren en te koppelen aan de inhoud van de lessen. Om informatie te krijgen om kinderen bij te spijkeren op bepaalde gebieden of klassikaal dingen opnieuw aan te bieden.

"Een toets is meer dan de afronding van een module"

Als je volstaat met alleen aan te geven waar een kind staat ten opzichte van de rest van de populatie, heb je wel heel weinig informatie. Een toets is meer dan de afronding van een module, het is ook de start van je volgende module. Heel veel docenten moeten die denkstap nog maken. Als toetsdeskundige vind ik dat ontzettend jammer. Heel veel informatie die toetsen geven, ook gestandaardiseerde toetsen, wordt niet genoeg gebruikt. En dan krijgt de toets een heel beoordelend karakter. Kunnen ze over de meetlat springen of niet.’

Werkt feedback op basis van toetsen?

De Jong: ‘Eén ding dat we heel erg verkeerd doen in ons onderwijs is dat we veel te lang wachten met feedback. Onderzoek laat zien dat feedback dan nauwelijks nog zin heeft. Onmiddellijke feedback, of zo onmiddellijk als mogelijk, is veel effectiever.

Daarom juich ik de ontwikkelingen van digitaal onderwijs zo toe. Dat geeft direct feedback waar iemand van leert. Denk maar aan de spellingschecker bij Word. Als we meer met computers kunnen toetsen, met onmiddellijke feedback, gaat dat echt helpen de onderwijsopbrengsten te vergroten. Tenminste, als we ons daarbij focussen op formatieve feedback.

"Focus op formatieve feedback. Niet voortdurend cijfers geven"

Niet voortdurend cijfers geven. Een cijfer is een zeer beperkte vorm van feedback. Het gaat erom dat je de leerlingen in tussentijdse toetsen informatie geeft over waar ze nog wat aan moeten doen, wat beter kan. Dat is belangrijker dan een eindoordeel over voldoende of onvoldoende.’

Hoe belangrijk is de focus op het verschil tussen het SE en het CE?

Veldkamp is daar kort over: ‘In de schoolexamens worden andere eindtermen getoetst dan in het centraal schriftelijk. Het is gek om de afwijking met het CE als beoordeling mee te nemen, zo plat zou je het niet mogen slaan. We moeten nog stappen zetten om op een andere manier te kijken naar het schoolexamen.

Scholen zouden niet moeten hoeven te schuiven met cesuren om problemen met de inspectie te voorkomen. Scholen moeten kunnen afwijken. Ze moeten dan wel kunnen verantwoorden dat de kwaliteit van hun metingen goed is.

Past de toets bij de eindtermen, is de toets te verantwoorden met een toetsmatrijs?
Is er sprake van een betrouwbare beoordeling met goede criteria? Denk aan scripties, projecten.
Kunnen de cijfers psychometrisch verantwoord worden?
Is er niet gefraudeerd?
Is er een goede procedure gevolgd?

Als scholen zichzelf goed gecontroleerd hebben en er is toch sprake van een afwijking, en die is verklaarbaar omdat er andere elementen getoetst worden, is dat alleen maar winst. Wij hebben een beoordelingskader (rcec.nl) en een checklist (toetsmagazine.nl/checklistrcec) ontwikkeld voor scholen, zodat ze zich inhoudelijk kunnen verantwoorden over hun examenkwaliteit.’

Hoe moeten we ons dan wel kunnen verantwoorden naar de inspectie?

Veldkamp: ‘De inspectie is met name geïnteresseerd in het gebruik van kwalitatief goede toetsen. Gestandaardiseerde toetsen hebben vaak als eigenschap dat er een verantwoording is van de kwaliteit. Daarom snap ik wel dat de inspectie hier op stuurt. Maar de garantie dat je op een verantwoorde manier meet – dat vind ik ook heel belangrijk – kun je ook geven als je eigen toetsen gebruikt. Of methodetoetsen.

Als je maar kunt onderbouwen dat ze goed zijn. Een docent die verstand heeft van toetskwaliteit is ook in staat gefundeerde wijzigingen aan te brengen in toetsen, om de toets nog beter te laten passen bij wat zijn leerlingen nodig hebben. Gestandaardiseerde toetsen passen goed bij een klas met standaardleerlingen, maar daar zijn er (gelukkig) maar weinig van.

Juist de vertaling van de standaardtoets naar het individuele kind in de klas zal toch door de docent moeten gebeuren. En zelfs als er een gestandaardiseerde toets gebruikt wordt, zal de docent toch nog moeten kunnen verantwoorden dat de kwaliteit van de toets op orde is. Je kunt van een standaardtoets niet verwachten dat hij optimaal is voor elke individuele leerling, ook gezien de diversiteit in het onderwijs.

Zo kom je uiteindelijk altijd weer bij de docent uit. Die zijn in hun vak heel goed, maar qua kennis van toetsen is er nog wat te winnen. Daarin zijn ze veel minder getraind, terwijl ze misschien wel 30% van hun tijd met toetsen bezig zijn’.

Terug naar de cesuurbepaling. Hoe belangrijk is een goede cesuurbepaling nu eigenlijk?

Haitjema: ‘Mijn dagelijkse werk bestaat voor een groot deel uit het bepalen van de kwaliteit van toetsen en examens en het bepalen van de cesuren aan de hand van statistiek en psychometrie. Gelukkig zijn er veel meer collega’s bezig met de fundamenten: een inhoudelijk verantwoorde toets, standaard of op maat.

"Als het fundament van een toets niet goed is, blijft het een gedrocht"

Want als het fundament van een toets niet goed is, als een toets inhoudelijk rammelt, kan ik er wel allemaal ingewikkelde analyses op uitvoeren, maar dan blijft het een gedrocht.’

Heb je vragen over dit thema? Stel ze in de onderwijs community binnen de Wij-leren.nl Academie!