Onderwijskwaliteit in het basisonderwijs in de periode 2009-2012
Geplaatst op 1 juni 2016
De resultaten van dit onderzoek wijzen uit dat het trainen en begeleiden van leerkrachten effecten heeft op hun vaardigheid in het analyseren van toetsresultaten, ze bekijken de resultaten in een breder kader en betrekken daar ook hun eigen handelen bij. Ook maken zij meer gebruik van groepsplannen. Er is weliswaar een positieve trend zichtbaar in de prestaties van leerlingen, maar er wordt geen significant verschil gevonden. Een jaar na de uitvoering van het deelproject is de positieve trend niet meer terug te vinden. Het ontbreken van significante, blijvende resultaten bij leerlingen kan te maken hebben met het onderbelichten van de inhoud van de groepsplannen (welke beslissingen nemen leerkrachten naar aanleiding van de analyse, kiezen ze de ‘juiste remedie’) en het feit dat er geen/te weinig borging van de wijze van analyseren heeft plaatsgevonden.
Van het vastleggen van referentieniveaus om bij leerkrachten een duidelijk beeld te hebben waar ze met leerlingen naar toe moeten werken is vooralsnog weinig effect te verwachten; hoewel meer leerkrachten in 2012 bekend zijn met de niveaus is hun verwachting van het effect gedaald en blijken zij niet goed te weten waar de niveaus eigenlijk liggen. Desgevraagd komen zij op zeer uiteenlopende niveaus uit, met name voor de betere leerlingen. Het onderwijs aan de betere leerlingen laat sowieso te wensen over. Hoewel de erkenning dat deze leerlingen de laatste decennia onvoldoende zijn bediend breed wordt gedragen blijkt het voor leerkrachten moeilijk om aan deze groep in de praktijk voldoende tijd en aandacht te besteden. Deels is dit te wijten aan het gebrek aan materiaal waarvan duidelijk is waar het toe leidt en of deze effecten ook behaald kunnen worden, maar voor een belangrijker deel aan de houding ten opzichte van en de vaardigheid in differentiëren. Inspectieonderzoek bevestigt de complexiteit van deze vaardigheden maar ook de urgentie: meer opbrengstgericht werken maakt verschillen tussen leerlingen nog duidelijker en daarmee ook de noodzaak om hier rekening mee te houden. Ook de kennis van en het inzicht in leerlijnen en methoden maakt dat leerkrachten moeite hebben in het schrappen van onderdelen, het uitbreiden van de leerstof en het stimuleren van complexe vaardigheden bij (betere) leerlingen.
Deze tekst is overgenomen uit de samenvatting van het eindrapport; zie bij Publicatie(s) hieronder.
Managementsamenvatting
In deze integrerende studie worden de hoofdlijnen van de uitkomsten van onderzoek uit de programmalijn ‘Onderwijskwaliteit PO’ uit het BOPO-programma IV (2009-2012), genaamd Streef, weergegeven en verklaard in het licht van het gevoerde beleid, de uitkomsten van ander (inter)nationaal onderzoek en theoretische kennis. Dit resulteert in een aantal implicaties voor beleid en onderzoek.
Beleidsachtergrond
Traditioneel wordt de organisatie van het onderwijs in Nederland gekenmerkt door ‘soevereiniteit in eigen kring’. De basisgedachte was dat autonome scholen het beste in staat zouden zijn om in te spelen op maatschappelijke veranderingen. Het beleid zette in op het liberaliseren van processen, terwijl er tegelijkertijd meer aandacht kwam voor toetsing op resultaten en verantwoording. Vanaf het begin van de jaren tachtig kwam er meer ruimte voor de evaluatiefunctie in het onderwijs. De beleidsfilosofie kreeg hiermee kenmerken van New Public Management, waarbij verantwoordingsverplichtingen als een counter-balance van geliberaliseerde processen functioneren. Hoewel er dus een sterke evaluatiefunctie werd gerealiseerd, werd deze volgens de Parlementaire Commissie Onderwijsvernieuwingen (2008), ook wel Commissie Dijsselbloem genoemd, niet gebruikt om het beleid daadwerkelijk te evalueren en functioneerden de verschillende evaluatievoorzieningen los van elkaar. De belangrijkste voorstellen van de commissie zijn verwerkt in de Kwaliteitsagenda en daarna het Actieplan Basis voor Presteren door het invoeren van leerstandaarden in het basisonderwijs en een meer op onderzoekgegevens gebaseerd onderwijsbeleid. In het beleid is geen afstand genomen van het principe om scholen meer autonomie te geven. In het middenveld zijn nieuwe krachtige structuren ontwikkeld, in de vorm van de PO en VO Raad. Deze voeren een eigen innovatiebeleid – net als de al bestaande onderwijsondersteuningsinstellingen - dat gebaseerd is op ontwikkeling vanuit de basis, vanuit het onderwijsveld in plaats van vanuit het beleid.
Wanneer men de situatie gedurende de afgelopen vijf jaar beziet dan is er een hernieuwing van de rationalisering van beleid in de vorm van evidencebased werken zichtbaar en zijn er tegelijkertijd zowel impulsen tot centralisatie als impulsen tot verdergaande decentralisatie en autonomie van onderwijsinstellingen. De beleidsinstrumenten en sturingsmechanismen zijn daarmee ook in twee ‘hoofdgroepen’ in te delen: de inzet van de infrastructuur van de onderwijsondersteuning gericht op het verbeteren van de eigen innovatiekracht van de scholen die zelf van onderaf innovaties moeten ontwikkelen en de inzet van de infrastructuur van doelen formuleren, toetsen en evalueren om te ‘controleren’ en te ‘sturen/bijsturen’. De vraag is of dergelijke innovaties niet te groot en veelomvattend zijn om voor zo’n groot deel overgelaten te worden aan de innovatiekracht van de individuele school.
Empirische en theoretische achtergrond
Omdat Nederland, sinds de jaren negentig, ruim heeft deelgenomen aan internationaal vergelijkend onderzoek naar de prestaties van leerlingen in het primair onderwijs zijn er op dit punt veel gegevens beschikbaar die vergeleken kunnen worden met bevindingen uit nationaal onderzoek zoals PPON en onderzoek door de onderwijsinspectie. De scores van de Nederlandse leerlingen liggen in internationaal onderzoek bijna altijd boven het gemiddelde. Op de mondiale ranglijst staat Nederland vaak wat lager vanwege de hoge scores in Aziatische landen. Wat betreft ontwikkelingen in de tijd gaat het te ver om te stellen dat er sprake is van een duidelijke achteruitgang in leerprestaties in het basisonderwijs in Nederland, maar er is in ieder geval geen sprake is van vooruitgang. Opmerkelijk is dat Nederlandse leerlingen in het hogere score segment relatief meer achteruitgang laten zien. De aanwijzigen voor een bescheiden teruggang in leerprestaties zoals die volgens sommigen naar voren komen in de internationale onderzoeken, worden nauwelijks bevestigd door de meer gedetailleerde nationale peilingonderzoeken. Het in algemene zin redelijk positieve beeld van het Nederlandse onderwijs wordt ook bevestigd in de rapportages van de onderwijsinspectie. Het percentage zeer zwakke basisscholen is gedaald tot beneden de 1%. Een zeer hoog percentage scholen haalt de normen op elementaire condities van goed onderwijs. Deze percentages zijn duidelijk lager op indicatoren van adaptief onderwijs en specifieke begeleiding en zorg. Iets minder dan de helft van de basisscholen voldeed op 1 september 2011 aan alle facetten van kwaliteitszorg en opbrengstgericht werken.
Opbrengstgericht werken is een belangrijk speerpunt in het huidige onderwijsbeleid. In onderwijseffectiviteitsonderzoek is van de verschillende kerncomponenten van opbrengstgericht werken als opbrengst- of prestatiegerichtheid, focus op basisvaardigheden, evaluatie- en monitoring, feedback, gestructureerde planning van didactische situaties, differentiatie en taakgerichte samenwerking tussen leerkrachten vaak een positieve associatie met leerprestaties vastgesteld (zie bijvoorbeeld Scheerens & Bosker, 1997). Hetzelfde geldt voor meer ondersteunende condities, zoals de optimalisering van onderwijstijd, onderwijskundig leiderschap en professionele ontwikkeling van leerkrachten, die eveneens onderstreept worden in de beleidsplannen. Opbrengstgericht werken lijkt dus voldoende evidencebased te zijn. Het synthetiseren van de kennis over onderwijseffectiviteit is echter een complexe aangelegenheid. In enkele recente ‘state of the art reviews’ (Reynolds e.a. 2012, Muijs e.a., 2012 en Hopkins e.a., 2012) kon weliswaar opnieuw een grote consensus over de in aanmerking komende factoren op school- en klasniveau worden geconstateerd, maar over de relatieve impact van de verschillende factoren is veel minder consensus evenmin als over de manier waarop verschillende componenten op elkaar inwerken (Scheerens, 2012). In de onderwijspraktijk komen de componenten vaak in onderlinge samenhang voor, als min of meer samenhangende conglomeraten zoals ook het concept van opbrengstgericht werken. In de resultaten van meta-analyses op het terrein van onderwijseffectiviteit blijkt relatief de meeste empirische support voor prestatiegerichtheid en een goede leerstofkeuze (opportunity to learn); de resultaten voor evaluatie zijn minder eenduidig, hoewel in veel onderzoeken flinke effecten worden gevonden voor de combinatie van evaluatie en instrumentele (in tegenstelling tot puur beoordelende) feedback.
Opzet en resultaten van Streef
Aan Streef heeft een groep van 120 scholen deelgenomen, die allen - in principe – met een bouw aan een van de deelprojecten deelnam en met het hele team en alle leerlingen aan de dataverzameling. Op die manier was elke school vertegenwoordigd in de ‘experimentele’ groep en in de controlegroep. De oorspronkelijke opzet om bouwen van scholen random toe te wijzen aan een deelproject kon niet gehandhaafd blijven omdat niet voldoende scholen aan Streef wilden deelnemen onder deze conditie. Voor het toeschrijven van eventuele effecten aan de interventie is deze keuze problematischer, immers, de motivatie om aan het deelproject mee te doen, en het feit dat het project inhoudelijk aansluit bij de schoolontwikkeling kunnen een belangrijke bijdrage hebben gehad aan eventuele effecten. Vasthouden aan de voorgestelde experimentele opzet zou echter betekenen dat het benodigde aantal scholen niet behaald zou worden en dat scholen mee moesten doen aan een project waarvoor zij misschien minder gemotiveerd zouden zijn. De kans op tussentijdse uitval is dan ook aanmerkelijk groter. Om toch een uitspraak te kunnen doen over of eventuele effecten naar waarschijnlijkheid veroorzaakt worden door de interventie is – gebruik makend van informatie over de scholen voorafgaand aan deelname – nagegaan in hoeverre er sprake is van validiteitsbedreigers.
De resultaten van Streef wijzen uit dat het trainen en begeleiden van leerkrachten effecten heeft op hun vaardigheid in het analyseren van toetsresultaten, ze bekijken de resultaten in een breder kader en betrekken daar ook hun eigen handelen bij. Ook maken zij meer gebruik van groepsplannen. Er is weliswaar een positieve trend zichtbaar in de prestaties van leerlingen, maar er wordt geen significant verschil gevonden. Een jaar na de uitvoering van het deelproject is de positieve trend niet meer terug te vinden. Het ontbreken van significante, blijvende resultaten bij leerlingen kan te maken hebben met het onderbelichten van de inhoud van de groepsplannen (welke beslissingen nemen leerkrachten naar aanleiding van de analyse, kiezen ze de ‘juiste remedie’) en het feit dat er geen/te weinig borging van de wijze van analyseren heeft plaatsgevonden.
Van het vastleggen van referentieniveaus om bij leerkrachten een duidelijk beeld te hebben waar ze met leerlingen naar toe moeten werken is vooralsnog weinig effect te verwachten; hoewel meer leerkrachten in 2012 bekend zijn met de niveaus is hun verwachting van het effect gedaald en blijken zij niet goed te weten waar de niveaus eigenlijk liggen. Desgevraagd komen zij op zeer uiteenlopende niveaus uit, met name voor de betere leerlingen. Het onderwijs aan de betere leerlingen laat sowieso te wensen over. Hoewel de erkenning dat deze leerlingen de laatste decennia onvoldoende zijn bediend breed wordt gedragen blijkt het voor leerkrachten moeilijk om aan deze groep in de praktijk voldoende tijd en aandacht te besteden. Deels is dit te wijten aan het gebrek aan materiaal waarvan duidelijk is waar het toe leidt en of deze effecten ook behaald kunnen worden, maar voor een belangrijker deel aan de houding ten opzichte van en de vaardigheid in differentiëren. Inspectieonderzoek bevestigt de complexiteit van deze vaardigheden maar ook de urgentie: meer opbrengstgericht werken maakt verschillen tussen leerlingen nog duidelijker en daarmee ook de noodzaak om hier rekening mee te houden. Ook de kennis van en het inzicht in leerlijnen en methoden maakt dat leerkrachten moeite hebben in het schrappen van onderdelen, het uitbreiden van de leerstof en het stimuleren van complexe vaardigheden bij (betere) leerlingen.
Implicaties
De houding van de scholen ten opzichte van de huidige beleidsspeerpunten is relatief positief (in vergelijking met het verleden). Toch is er verbetering mogelijk en heeft het onderzoeksprogramma Streef niet uitgewezen hoe de situatie is bij scholen die zich niet zelf hebben geselecteerd voor onderzoek en ontwikkeling op dit terrein. Ook kan Streef vanwege het loslaten van de randomisering niet met zekerheid bewijzen dat de interventies de effecten (bij leerkrachten) veroorzaken, dit kan hoogstens aannemelijk gemaakt worden. Overigens verdient het wel aanbeveling om te overwegen op welke manier de deelname bereidheid van scholen om aan onderzoek mee te doen gestimuleerd kan worden als men waarde hecht aan evidencebased kennis. Echte experimenten leveren daartoe – hoewel daarover wel discussie is – uiteindelijk (nadat op basis van eerder/ander onderzoek een onderwijskundige theorie geconcretiseerd is in een praktische en overdraagbare interventie) het enige bewijs dat de theorie werkt.
Kennisname van (internationaal) onderzoek en onderwijseffectiviteit onderzoek toont aan dat er evidentie is voor het belang van de huidige speerpunten met betrekking tot opbrengstgericht werken en de aandacht voor goede leerlingen is groot. Voor opbrengstgericht werken is er ook evidentie wat betreft de mogelijk te behalen effecten, evidentie voor excellentie betreft vooral de noodzaak om iets te doen, niet zozeer ‘hoe’ dat dan zou moeten gebeuren (de inhoud). Hoewel keuzes in beleidsinstrumenten (m.n. communiceren, stimuleren en subsidiëren) wel te begrijpen zijn in het licht van de historie is het wel de vraag of er echt structurele verbeteringen te verwachten zijn.
Er is een groot ‘geloof’ in een bottom-up benadering, waarbij wordt aangenomen dat de beste resultaten worden bereikt als scholen werken volgens een idee dat zij zelf hebben ontwikkeld. Internationale ervaringen, bijvoorbeeld met Comprehensive School Reform programma’s in de Verenigde Staten laten zien dat er een alternatief is, dat waarschijnlijk meer doeltreffend en doelmatig is.
Het niveau van de leerkrachten is onvoldoende wat betreft kennis en wat betreft differentiatievaardigheden. De vraag is in hoeverre differentiatie in alle opzichten een haalbaar ideaal is. Zou dit niet eerder ook het werk moeten zijn van experts/onderzoekers/ontwikkelaars? In eerste plaats zou bij leerkrachten in ieder geval de houding aanwezig moeten zijn om te werken met iets dat bewezen effectief is. Ook de vaardigheden in bijvoorbeeld het managen van de klas moeten bij elke leerkracht voldoende zijn om differentiatie in de klas mogelijk te maken, om voldoende time-on-task te creëren, die ook nog kwalitatief goed wordt besteed. Voldoende kennis om goede leerstofkeuzes te maken zou eventueel bij ontwikkelaars kunnen liggen (koppeling met methoden en ‘recepten’ voor oplossing van hiaten, maar toch vraagt dit ook een bepaalde houding van leerkrachten, namelijk om handleidingen te lezen en volgen. Essentieel is ook de houding dat leren leuk is, dat goede prestaties niet ‘overdreven’ zijn. Tenslotte is het van belang dat de ingezette vernieuwingen beklijven en dat scholen hier zelf sturing geven. Een punt van aandacht is ook het aanbod van verzorgingsinstellingen, waarvan de kwaliteit niet gegarandeerd is. Er is te weinig systematisch, cyclisch werken, te veel ad hoc. Een gunstige conditie is dat het toetssysteem als ruggengraat van opbrengstgericht werken functioneert.
Suggesties voor vervolgonderzoek liggen op het terrein van R&D ten aanzien van ontwikkeling van leermateriaal, haalbaarheid van een alternatief voor de dominante bottom up innovatie en implementatie strategie en onderzoek naar de effectiviteit van de verzorging en ondersteuning bij opbrengstgericht werken en experimenten met Comprehensive School Reform benaderingen
Details van het onderzoek
NWO-projectnummer: | 413-11-002 |
Titel onderzoeksproject: | Reviewstudie Onderwijskwaliteit |
Looptijd: | 01-08-2012 tot 12-08-2013 |
Projectleider(s)
Naam | Instelling | |
---|---|---|
Dr. S. Doolaard | Rijksuniversiteit Groningen | s.doolaard@rug.nl |
Projectuitvoerder(s)
Naam | Instelling | |
---|---|---|
Jaap Scheerens | Rijksuniversiteit Groningen |
Publicatie(s)
Relevante links(s)
[Bron: Nationaal Regieorgaan Onderwijsonderzoek (NRO)]