Deel 3 Leesrijpheid: het bepalen van leesrijpheid vergelijking van twee toetsen

Ewald Vervaet

Ontwikkelingspsycholoog en docent bij Stichting Histos

Geplaatst op 1 juni 2015

Dit is het derde paneel van een drieluik

5 De resultaten van de Citotaaltoets

In §5.1 presenteren we de scores van de Citotaaltoets. Dan bekijken we de hele toets (§5.2) en de 30 geletterdheidsopgaven op relevantie voor leesrijpheid (§5.3). In §5.4 trekken we onze slotconclusie over de Citotaaltoets en bespreken we mogelijke kanttekeningen daarbij.

5.1 De scores van de Citotaaltoets

In tabel 2 staan de scores van de veertien proefpersonen.

Naam   PW   KL   KR   EL   AS   SO   GT   GL   TOT
  15   15   8   6   8   8 30 30 60
Bo 12   10   8   6   8   8 22   30    52 (B)
Cas 7 10 8   6 8 8 17   30 47 (C)
Debbie   10   11   8   6 8 4 21   26 47 (C)
Dees 12 14 7 6 8   8 26   29 55 (A)
Demi 14   13   8   6   8   8 27   30 57 (A)
Floris 10   10   4   5   3   7 20   19   39 (D)
Jesper 12   15    7   6   8   8 27   29   56 (A)
Lisa 12   13   6   6   8   7 25   27   52 (B)
Mikkel 11   13   7   6   7   8 24   28   52 (B)
Noery 10   6   8   6   7   4 16   25   41 (D)
Rosa 14   13   7   6   3   7 27   23   50 (B)
Siemen 14   14    7   5   8   8 28   28   56 (A)
Teun 14   14   8   6   7   8 28   29   57 (A)
Toon 12   14   8   6   8   7 26   29   55 (A)

Tabel 2. De scores van de veertien proefpersonen op de Citotaaltoets. De uitleg staat in de hoofdtekst.

Op de bovenste regel staan 'Naam', PW (voor 'passieve woordenschat'), KL (voor 'kritisch luisteren'), KR (voor 'klank en rijm'), EL (voor 'eerste en laatste woord horen'), AS (voor 'auditieve synthese'), SO (voor 'schriftoriëntatie'), GT (voor 'gesproken taal' die ontstaat als men PW en KL, die volgens de verantwoording met de gesproken taal in verband staan, bij elkaar optelt), GT (voor 'geletterdheid' die ontstaat als men de vier geletterdheidscategorieën KR, EL, AS en SO bij elkaar optelt) en TOT (voor 'totaal', de som van GT en GL).

Op de tweede regel staat de maximale score op de categorie erboven. De maxima komen overeen met het aantal opdrachten per categorie; zie §4.4.

Onder 'Naam' staan de namen van de veertien proefpersonen. Naast een naam staan de scores per categorie. Achter de totaalscore staat tussen haakjes het nivo dat het kind volgens de Citotaaltoets heeft.

Als gesteld in §4.3: wat geletterdheid betreft kan de Citotaaltoets op ten minste twee manieren worden gebruikt. Met de afkortingen van hierboven: de totaalscore TOT zou relevant kunnen zijn voor leesrijpheid en alleen de geletterdheidsscore GL zou dat kunnen zijn. Zie verder §5.2 respectievelijk §5.3.

5.2 Totaalscore en leesrijpheid

We vergelijken de totaalscores op de Citotaaltoets met de resultaten op de leesrijpheidstoets van §3. Vóór deze vergelijking pleit het feit dat één van de twee auteurs van de verantwoording, Nienke Lansink, mede-auteur is van een artikel waaruit duidelijk opgemaakt kan worden dat een A-score op de Citotaaltoets geacht mag worden met leesrijpheid te maken te hebben. Over 'kinderen [in groep 2], die in de hoogste categorie scoren' schrijven ze: 'Wat doet u met deze kleuters, als u niet vooruit wilt lopen op het aanbod in groep 3'. En over de vijf kinderen in hun voorbeeld met een A: 'U wilt in kleutergroepen niet alvast een voorschot nemen op het onderwijsaanbod in groep 3'. Hierin verdisconteren we het feit dat de verantwoording onder meer schrijft: 'Het onderwijs in lezen [...] start in principe in groep 3' en 'in principe verwachten we dat leerlingen pas in groep 3 de tussendoelen genoemd onder de kopjes 6 tot en met 10 gaan beheersen', terwijl onder kopje 8 staat: 'technisch lezen [...]'.

Naam Leesrijpheid code
Bo onveilig drieletterig leesrijp   Y
Cas veilig meerletterig leesrijp V
Debbie niet leesrijp Z
Dees niet leesrijp Z
Demi onveilig drieletterig leesrijp Y
Floris niet leesrijp Z
Jesper   niet leesrijp Z
Lisa niet leesrijp Z
Mikkel   onveilig drieletterig leesrijp   Y
Noery niet leesrijp Z
Rosa niet leesrijp Z
Siemen onveilig meerletterig leesrijp X
Teun onveilig meerletterig leesrijp X
Toon onveilig meerletterig leesrijp X

Tabel 3. De resultaten van de veertien proefpersonen op de leesrijpheidstoets. De uitleg staat in de hoofdtekst.

De totaalscores op de Citotaaltoets staan in tabel 2. De resultaten op de leesrijpheidstoets staan in tabel 3. Erachter staan de codes die men aan de soorten leesrijpheid kan toekennen.

V = veilig meerletterig leesrijp;
W = veilig drieletterig leesrijp;
X = onveilig meerletterig leesrijp;
Y = onveilig drieletterig leesrijp;
Z = niet leesrijp.

Het karakter van deze vijfdeling is geheel anders dan die van de Citotaaltoets. In deze laatste staan ze voor een getalsmatig interval. B bijvoorbeeld staat voor 'tussen 0% en 25% boven het gemiddelde'.³ De codes van de leesrijpheidstoets daarentegen staan voor kwaliteiten. Zo staat X voor 'onveilig meerletterig leesrijp'.

Om de vergelijking tussen beide toetsen zo gemakkelijk mogelijk te maken staan ze naast elkaar, met per kind alle resultaten op één regel.

De frekwenties van de codes zijn als volgt.

Citotaaltoets A 6 B 4 C 2 D 2 E 0
Leesrijpheidstoets V 1 W 0 X 3 Y 3 Z 7

Er zijn vele verschillen tussen de scores op de twee toetsen. We bespreken er slechts vijf.

Volgens de leesrijpheidstoets is slechts één kind veilig meerletterig leesrijp (V): Cas. Toch heeft hij op de Citotaaltoets geen A, maar een C.
Van de zes kinderen die op de Citotaaltoets een A scoren, is er niet één veilig meerletterig leesrijp (V), maar zijn er drie onveilig meerletterig leesrijp (X: Siemen, Teun, Toon), één onveilig drieletterig leesrijp (Y: Demi) en twee niet leesrijp (Z: Dees, Jesper). Ter verdediging van de Citotaaltoets zou men kunnen stellen dat vier kinderen in elk geval (drie- of vierletterig) leesrijp zijn: Demi, Siemen, Teun en Toon. Voor twee kinderen gaat dit echter niet op: Dees en Jesper zijn niet leesrijp. Bovendien is bij hen het contrast tussen de toetsen maximaal: hoogste score op de Citotaaltoets (A), maar laagste score op de leesrijpheidstoets (Z).
Van de vier kinderen met een B op de Citotaaltoets zijn er twee onveilig drieletterig leesrijp (Y: Bo, Mikkel), maar ook twee niet leesrijp (Z: Lisa, Rosa).
Omgekeerd: van de zeven kinderen die volgens de leesrijpheidstoets niet leesrijp zijn (Z) hebben er op de Citotaaltoets twee een A (Dees, Jesper), twee een B (Lisa, Rosa), één een C (Debbie) en twee een D (Floris, Noery). Niet-leesrijpe kinderen kunnen op de Citotaaltoets kennelijk tussen 50% boven het gemiddelde (maximum binnen A) en 40% onder het gemiddelde scoren (minimum binnen D). De totaalscore op de Citotaaltoets zegt bij de kinderen met een A dus nauwelijks iets over leesrijpheid.
Tot slot valt het op dat de twee kinderen met een C op de Citotaaltoets in geheel verschillende mate leesrijp zijn: Cas en Debbie.29 De eerste is veilig meerletterig leesrijp (V) en de tweede niet leesrijp (Z). Ook hier is het contrast dus maximaal. Een C op de Citotaaltoets (0-25% onder het gemiddelde) kan kennelijk zowel voor optimale leesrijpheid staan als voor totale leesonrijpheid: terwijl Cas ook een vijfletterig woord (vrijwel) onmiddellijk leest, kan de leesproef met Debbie niet eens gedaan worden omdat ze zich in haar vrije spel te weinig letters heeft eigen gemaakt. Zelfs van haar naam – doorgaans toch het eerste woord dat een kind wil en kan schrijven – kent ze maar één letter en dan nog is het onduidelijk of dat de 'd' is of de 'e'.

Samenvattend kunnen we stellen dat de totaalscore op de Citotaaltoets vrijwel geheel ongeschikt is voor de bepaling van leesrijpheid. Aan de hand van de bevindingen van §4 is het niet moeilijk dit te verklaren: de theoretische achtergrond is zeer ontoereikend en de meetwijze is volstrekt niet houdbaar.

5.3 Geletterdheidsscore en leesrijpheid

We beperken ons nu tot de som van de scores op de vier geletterdheidscategorieën, door ons 'geletterdheid' (GL) genaamd. Zie tabel 2. We bespreken hier acht punten. In de punten 5-8 bekijken we elk van de GL-categorieën afzonderlijk.

1. Drie kinderen hebben een maximale GL-score, namelijk 30: Bo, Cas en Demi. Hun leesrijpheid is echter heel verschillend. Cas is veilig meerletterig leesrijp (V), maar Bo en Demi zijn allebei onveilig drieletterig leesrijp (Y).

2. Vier kinderen hebben een GL-score 29: Dees, Jesper, Teun en Toon. Terwijl Bo en Demi met score 30 drieletterig leesrijp zijn, zij het onveilig (Y), staan Teun en Toon met één punt minder in leesrijpheid toch een nivo hoger: zij zijn meerletterig leesrijp, zij het eveneens onveilig (X)). Daar staat tegenover dat Dees en Jesper met precies dezelfde score 29 niet leesrijp zijn (Z) en dus een nivo onder Bo en Demi staan.

3. Twee kinderen hebben een GL-score 28: Mikkel en Siemen. Mikkel is onveilig drieletterig leesrijp (Y) en Siemen onveilig meerletterig leesrijp (X).
De punten 1-3 samen nemend, blijken er dus negen kinderen te zijn met een GL-score 28-30, terwijl hun leesrijpheid van 'niet leesrijp' (Dees, Jesper; GL: 29) tot 'veilig meerletterig leesrijp' (Cas; GL: 30) loopt.

4. De overige vijf kinderen hebben een GL-score 27 (Lisa), 26 (Debbie), 25 (Noery), 23 (Rosa) en 19 (Floris)30. Ze zijn alle vijf niet leesrijp. Althans voor onze veertien proefpersonen zou men dus kunnen stellen dat de GL-score wat over leesrijpheid zegt: wie 27 of lager scoort is niet leesrijp. Het omgekeerde geldt uiteraard niet: Dees en Jesper zijn niet leesrijp en hebben een GL-score van 29.

Ook hier doet zich een merkwaardig feit voor. De scores van de vijf leesonrijpe kinderen met een GL-score 27 of lager verschillen maximaal 8 punten van elkaar (27-19), terwijl de scores van de andere negen kinderen maximaal slechts 2 punten van elkaar verschillen (30-28). Anders gezegd, het eenduidige 'niet leesrijp bij een score van 27 of minder' komt overeen met een relatief groot scoreverschil, namelijk 8 punten. Het veelduidige 'leesrijp bij een score van 28 of meer' (de leesrijpheden lopen van 'onveilig drieletterig' tot 'veilig meerletterig') daarentegen komt overeen met een relatief klein scoreverschil, namelijk 2 punten.

Was de totaalscore van de Citotaaltoets te globaal, de GL-score is dat kennelijk ook. We lopen daarom de vier GL-categorieën globaal een voor een langs: zullen een of meer van de GL-categorieën leesrijpheid correct weergeven?

5. De scores op 'klank en rijm' zijn als volgt.

KR-score 8: zeven kinderen, onder wie Cas (V), Debbie (Z) en Noery (Z).
KR-score 7: vijf kinderen.
KR-score 6: één kind.
KR-score 4: één kind.

De leesrijpheden van de kinderen met een KR-score 8 lopen van 'veilig meerletterig leesrijp' (V) tot en met 'niet leesrijp' (Z; twee maal). Bij deze zeven kinderen onderscheidt KR dus volstrekt niet op leesrijpheid.

6. De scores op 'eerste en laatste woord horen' zijn als volgt.

EL-score 6: twaalf kinderen, onder wie Cas (V), Debbie (Z), Dees (Z), Jesper (Z), Lisa (Z), Noery (Z) en Rosa (Z).
EL-score 5: twee kinderen.

De leesrijpheden van de kinderen met een EL-score 6 lopen van 'veilig meerletterig leesrijp' (V) tot en met 'niet leesrijp' (Z; zes maal). Bij deze twaalf kinderen onderscheidt EL dus volstrekt niet op leesrijpheid.

7. De scores op 'auditieve synthese' zijn als volgt.

AS-score 8: negen kinderen, onder wie Cas (V), Debbie (Z), Dees (Z), Jesper (Z) en Lisa (Z).
AS-score 7: drie kinderen.
AS-score 3: twee kinderen.

De leesrijpheden van de kinderen met een AS-score 8 lopen van 'veilig meerletterig leesrijp' (V) tot en met 'niet leesrijp (Z; vier maal). Bij deze negen kinderen onderscheidt AS dus volstrekt niet op leesrijpheid.

8. De scores op 'schriftoriëntatie' zijn als volgt.

SO-score 8: acht kinderen, onder wie Cas (V), Dees (Z) en Jesper (Z).
SO-score 7: vier kinderen.
SO-score 4: twee kinderen.

De leesrijpheden van de kinderen met een SO-score 8 lopen van 'veilig meerletterig leesrijp' (V) tot en met 'niet leesrijp' (Z; twee maal). Bij deze acht kinderen onderscheidt AS dus volstrekt niet op leesrijpheid.

We vatten samen. Zowel de geletterdheidsscore GL als de scores op de vier geletterdheidscategorieën KR, EL, AS en SO zijn vrijwel geheel ongeschikt om de leesrijpheid van een kind mee te bepalen. En ook hier geldt wat we aan het slot van §5.2 concludeerden: de bevindingen van §4 maken het ons gemakkelijk om dit te verklaren want de theoretische achtergrond van de Citotaaltoets en dus ook van de GL-deeltoets is zeer ontoereikend en de meetwijze is volstrekt niet houdbaar.

5.4 Slotconclusie en mogelijke kanttekeningen

Na de conclusies van §5.2 en §5.3 kan de slotconclusie over de Citotaaltoets kort zijn. Ze is tweeledig.

a. De Citotaaltoets is in ontwikkelingspsychologisch opzicht zeer ontoereikend om leesrijpheid te bepalen.

(i) Geletterdheid wordt ten onrechte als een taalvaardigheid geduid en niet als een ruimtelijke vaardigheid die op taal wordt toegepast (§4.1, A).
(ii) De ontwikkeling van geletterdheid wordt deels onvolledig en deels onjuist beschreven; met name splitst de verantwoording leesrijpheid ten onrechte over twee fasen, namelijk in haar fasen 2 en 3 (§4.1, B).
(iii) De opgaven van de Citotaaltoets dekken de ontwikkeling van leesrijpheid op essentiële punten in het geheel niet, niet in de gehele toets van 60 opgaven (§5.2), maar ook niet in de 30 geletterdheidsopgaven en ook niet in de 6 of 8 opgaven van de vier afzonderlijke geletterdheidscategorieën (§5.3).

b. De Citotaaltoets is meettheoretisch een non-instrument in verband met leesrijpheid of met wat voor vermogen dan ook, vanwege de onhoudbaarheid van de inferentiële statistiek in het algemeen en van de psychometrie in het bijzonder (§4.2 en §4.3).

Bij deze slotconclusie zou men mijns inziens vanuit psychometrisch standpunt ten minste twee kanttekeningen kunnen maken, die vanuit ons standpunt weersproken kunnen en moeten worden.

Veertien proefpersonen

In de eerste plaats zou men kunnen tegenwerpen dat veertien proefpersonen te weinig is. Mijn reactie daarop is drieledig.

Ten eerste, naar ik me van mijn docent statistiek, dr. Piet Pelle, meen te herinneren uit mijn studietijd is het minimum aantal metingen waarop men inferentiële statistiek mag bedrijven, zes. Het aantal proefpersonen van dit onderzoek, veertien, steekt daar dus ver boven uit. Wie geen bezwaar heeft tegen zes metingen in inferentieel-statistiek onderzoek kan ook geen bezwaar hebben tegen empirisch-feitelijk onderzoek omdat het met veertien proefpersonen gedaan is.
Ten tweede, ik breid mijn aantal proefpersonen graag uit als de aanhangers van de inferentiële statistiek en/of van de psychometrie mijn kritiek op deze onderzoeksmethodes hebben weerlegd en/of indien er uit ander empirisch-feitelijk onderzoek dan het mijne feiten naar voren komen, die aanleiding geven tot nieuw onderzoek van mijn kant.
Ten derde, de verantwoording schrijft over onderzoek naar het samenstellen van de itembank van de Citotaaltoets. Daarin is onder meer sprake van 1021, 1103, 893 en 975 proefpersonen in groep 2. Tegenover deze aantallen valt het aantal van veertien proefpersonen uiteraard in het niet. Echter, een tekort aan theoretische relevantie (zie punt (a) van de slotconclusie) kan nooit opgevuld worden met of gecompenseerd worden door grotere aantallen. Een niet bestaand verschijnsel (zoals Ptolemaios' vereffeningspunt of Blondlots N-straling) wint niet aan werkelijkheidswaarde als men 1000 metingen doet en hun waarden aan dat verschijnsel toedicht. Zo is het ook hier: zelfs als de inferentieel-statistische methode en de psychometrie houdbaar zouden zijn (wat dus vooralsnog niet het geval lijkt te zijn), dan nog zijn metingen vanuit de gedachtes over geletterdheid en haar ontwikkeling van de verantwoording van geen enkele betekenis of waarde voor leesrijpheid of wat voor geletterdheidsverschijnsel ook maar, enkel en alleen omdat die gedachtes niet houdbaar zijn. Zie nogmaals §4.1, A en B.

Nauwkeurigheid van de scores

In de tweede plaats zou men kunnen tegenwerpen dat in §5.2 en §5,3 geen rekening is gehouden met de nauwkeurigheid van de scores op de Citotaaltoets. Over die nauwkeurigheid schrijft de verantwoording dat het onderscheidende vermogen van de Citotaaltoets 'optimaal is gemaakt in de scoreregionen waar dit het belangrijkste is, namelijk daar waar de zwakkere van de gemiddelde leerlingen moeten worden onderscheiden. [...] Veruit de meeste leerlingen die de toets maken, hebben een vaardigheid waarbij de toets een lage standaardmeetfout heeft'.

De nauwkeurigheid voor het hele scorebereik staat in tabel 4. Het linkergedeelte heeft betrekking op de afname van de Citotaaltoets halverwege het schooljaar en het rechtergedeelte op die aan het eind van het school jaar. W staat voor 'scoregroep waarin ware score valt', A-E zijn de vijf nivo's van de Citotaaltoets. Het getal 76 links boven betekent volgens de verantwoording dat 76% van de leerlingen die op de Citotaaltoets een E halen, 'ook met hun werkelijke vaardigheidsscore in deze scoregroep vallen'. Het getal 24 onder die 76 betekent volgens de verantwoording dat 24% 'van de leerlingen in niveaugroep E een vaardigheidsscore heeft die in werkelijkheid in scoregroep D valt'.

W   E   D   C B A    W   E D   C B A
E 76 8   0,1 0,0   0,0   E 76   9   0,1 0,0 0,0
D 24   60   12   0,3   0,0   D 24 54   10 0,5 0,0
C 0,6 31   63 20 1,0   C 1,0   35   57 20 2
B   0,0 0,9 25 59 20 B   0,0 1,9 30 54 24
A   0,0 0,0 0,9   21 78   A   0,0 0,0 3 25 74

Tabel 4. De betrouwbaarheidstabellen bij de papieren versie van de Citotaaltoets, die ook de 'lokale meetnauwkeurigheid' weergeeft. Alle getallen boven 2 zijn afgerond. Verdere uitleg staat in de hoofdtekst.

Ten eerste, althans ten aanzien van leesrijpheid vinden wij zeer forse afwijkingen van het beeld van tabel 4. Voorbeeld 1. §5,2, punt 4: de scores A-D, dus 90% van het bereik, kunnen voor niet-leesrijpheid (Z) staan. Voorbeeld 2. §5.2, punt 5: zowel Cas (veilig meerletterig leesrijp: V) als Debbie (niet leesrijp: Z) heeft een C. Voorbeeld 3. §5.3, de punten 1-3: de GL-scores 28-30 kunnen zowel voor 'niet leesrijp' (Z: Dees, Jesper) staan als voor 'veilig meerletterig leesrijp' (V: Cas).

Ten tweede, de getallen 76, 60, 63, 59 en 78 op de diagonaal links betekenen volgens de verantwoording dat 76% van de E-scoorders halverwege het schooljaar terecht een E heeft, 60% van de D-scoorders terecht een D, 63% van de C-scoorders terecht een C, 59% van de B-scoorders terecht een B en 78% van de A-scoorders terecht een A heeft. En evenzo betekenen volgens de verantwoording dat de getallen 76, 54, 57, 54 en 74 op de diagonaal rechts dat 76% van de E-scoorders op het eind van het schooljaar terecht een E heeft, 54% van de D-scoorders terecht een D, 57% van de C-scoorders terecht een C, 54% van de B-scoorders terecht een B en 74% van de A-scoorders terecht een A. De keerzijde hiervan is dat 24%, 40%, 37%, 41%, 22%, 24%, 46%, 43%, 46% respectievelijk 26% van de leerlingen ten onrechte tot een bepaald nivo wordt gerekend. Ik vind dat zeer aanzienlijk. Vooral het percentage 46, dat hier twee keer in voorkomt, acht ik regelrecht verontrustend: bijna de helft van de kinderen wordt hier ten onrechte tot een bepaald nivo gerekend. Die verontrusting wordt er niet minder op als we naar de getallen meteen boven en meteen onder de beide 54 kijken. Ze luiden 9% (de D-scoorders zouden in werkelijk een E hebben), 35% (de D-scoorders zouden in werkelijkheid een C hebben), 20% (de B-scoorders zouden in werkelijkheid een C hebben) en 25% (de B-scoorders zouden in werkelijkheid een A hebben). Die 35% springt er om twee redenen uit. (i) Het betreft hier een heel groot percentage van de kinderen: meer dan 1/3 van de leerlingen met een D-score zou in werkelijkheid een C hebben. (ii) Op veel scholen krijgen kinderen met een E- of D-score op de Citotaaltoets een behandelprogramma zodat dat volgens de verantwoording bij iets meer dan 1/3 van de D-scoorders niet te recht is omdat ze in werkelijkheid C-scoorders zouden zijn.

"Kortom, de nauwkeurigheid van de Citotaaltoets, ook ten aanzien van leesrijpheid, is buitengewoon gering".

Ook de tegenwerping dat de meetnauwkeurigheid van de Citotaaltoets te onrechte over het hoofd gezien zou zijn, houdt dus geen stand.

Alles overziende, blijft er van de Citotaaltoets niet veel overeind. Zijn theoretische achtergrond is niet houdbaar en niet toereikend; er zit een methodologie achter die niet in staat is om geldige en betrouwbare kennis voort te brengen; mogelijke tegenwerpingen als 'veertien proefpersonen is te weinig' en 'als de nauwkeurigheid van de Citotaaltoets wordt meegenomen, ligt het allemaal veel gunstiger' houden geen stand.

Vanwege de theoretische en methodologische tekorten is een test slechts in getallen verpakte willekeur. Als meetinstrument is de Citotaaltoets dan ook het best te vergelijken met een elastiek als 'meetinstrument' om lengtes mee op te meten; zie hoe de veilig leesrijpe Cas (V) en de niet leesrijpe Debbie (Z) (tabel 3) allebei C scoren op de Citotaaltoets (tabel 2). In dat perspectief is het aantal van veertien proefpersonen erg veel.

6 De inschattingen van de leerkrachten

Als geschetst in §1, voordat de leerkrachten van de veertien proefpersonen de resultaten van de leesrijpheidstoets hebben vernomen, hebben ze hun inschatting van de leesrijpheid van elk van die veertien kinderen te geven. Hun leerkrachten zijn Kasparina van der Werff en Mariëlle Veldman. Ik vroeg hen per kind om twee vragen te beantwoorden.

De eerste vraag betrof hun schatting van de leesrijpheid in de periode 15-31 januari 2014. Bijvoorbeeld bij Bo (bij een ander kind staat diens naam in plaats van 'Bo'): 'Bo's mate van leesrijpheid in de periode 15-31 januari 2014 schat ik als volgt in:'.

De tweede vraag luidde, alweer met Bo als voorbeeld: 'Haar scores op de Citotoets 'Taal voor kleuters' (12, 10, 8, 6, 8, 8, 52) herken ik wel/niet in haar mate van leesrijpheid:'. Daarin geef ik dus zeven scores, namelijk de scores van tabel 2 minus GT en GL.
Op 17 februari ontvang ik hun antwoorden.

Uiteindelijk betrek ik de reacties op de tweede vraag om twee redenen niet in mijn betoog.

Ten eerste, omdat ik er vóór het hele vergelijkende onderzoek van uit ging dat de Citotaaltoets in ontwikkelingspsychologisch opzicht enige basis zou hebben, nam ik aan dat de resultaten ermee en de resultaten van de leesrijpheidstoets elkaar niet heel veel zouden ontlopen. Ik hoopte daarom dat deze twee vragen informatie zouden opleveren om verder tussen de Citotaaltoets en de leesrijpheidstoets te kunnen differentiëren bij bepaalde kinderen. En in beginsel zouden juf Kasparina en juf Mariëlle mede naar aanleiding van hun schriftelijke reacties in een mondelinge toelichting op alles, dus ook op de resultaten van de leesrijpheidstoets, nog verdere informatie geven. Echter, al tijdens het lezen van de verantwoording10, na het afnemen van de proeven op 29 januari en 7 februari, wordt me duidelijk dat de ontwikkelingspsychologische basis van de Citotaaltoets veel minder voorstelt dan ik had gehoopt. Tijdens het schrijven van dit artikel wordt die indruk alleen maar versterkt zoals men zal begrijpen na het lezen van §4-5. Met name het vragen naar de reactie van de leerkrachten op de scores voor de verbale categorieën PW en KL werd hierdoor niet meer zinvol. Daardoor verviel ook de zin van het vragen naar hun reactie op de totale score TOT, die immers voor de helft op mondelinge taalvermogens mikt en irrelevant is voor leesrijpheid (zie met name §4.1, A).

Ten tweede, ik kwam er tijdens het bestuderen van de vier GL-categorieën spoedig achter dat hun differentiërende vermogens gering zijn; zie §5.3, de punten 5-8. Hierdoor werd het vragen naar de reacties van de leerkrachten op de scores van de categorieën KR, EL, AS en SO niet meer zinvol.

Omdat het vragen naar geen van de zeven scores in de tweede vraag hiermee komt te vervallen, is de zin van de vraag dus helemaal weg.

We beperken ons dus tot de reacties van de leerkrachten op de eerste vraag.

De relevantie van deze vraag is afgenomen door ontwikkelingen die tijdens het hele onderzoek hebben plaats gehad. Onder het uitwerken van de leesrijpheidstoets en het schrijven van §3 wordt me namelijk de noodzaak van de vierdeling binnen leesrijpheid steeds duidelijker: 'onveilig drieletterig', 'onveilig meerletterig', 'veilig drieletterig' en 'veilig meerletterig'. De noodzaak daartoe wordt bevestigd door de proeven die deelnemers aan mijn cursus 'Leesrijpheid; leren lezen in 40 uur – als het kind eraan toe is!' inzenden. Dat daardoor de relevantie van die vraag afneemt heeft twee redenen. Enerzijds maakt die vierdeling de vraagstelling te weinig specifiek omdat ik daarin slechts spreek over 'mate van leesrijpheid' in het algemeen. Anderzijds kennen die leerkrachten die vierdeling niet zodat ze er in hun reactie ook geen rekening mee kunnen houden. Aan de ene kant zullen zij het aspect veilig/onveilig hoogstwaarschijnlijk niet in hun inschatting betrekking. En aan de andere kant zullen ze ertoe neigen een kind leesrijp te achten als ze merken dat het drieletterige woorden kan lezen. In feite was dat ook de reden dat juf Anja en de juffen Annelies en Janneke een aantal kinderen leesrijp hadden verklaard, terwijl me op 4 maart 2013 duidelijk wordt dat de kinderen in Spoordonk dat slechts op drieletterig nivo zijn.33

We lopen nu de veertien kinderen een voor een langs. We geven eerst de reactie van de leerkrachten op de eerste vraag, waarbij ze zich steeds in de ik-vorm uitdrukken. Dan volgt ons commentaar. Daarin besluiten we met één van de drie conclusies. (a) Als hun reacties en de uitkomsten van de leesrijpheidstoets elkaar bevestigen, geven we dat kort aan met 'wederzijdse bevestiging'. (b) Als ze elkaar weerspreken, geven we dat aan met 'wederzijdse weerlegging'. (c) Als ze elkaar niet bevestigen maar ook niet weerleggen, geven we dat aan met 'geen wederzijdse weerlegging'.

* Over Bo: 'Bo kent al redelijk wat letters, maar ik denk nog te weinig om te kunnen lezen'.

Commentaar. In §3.1 blijkt Bo redelijk wat letters te kennen, terwijl ze drieletterig leesrijp is, waarbij ze 'o' in eerste instantie als /oo/ leest en 'a' als /aa/. Bo maakt op mij een wat verlegen indruk en zegt al gauw dat ze iets moeilijk vindt (bij het toetswoord 'kip') of dat ze iets niet weet (bij de toetswoorden 'dans' en 'stok'). Ik sluit niet uit dat ze om die redenen in de klas minder van haar leesrijpheid op drieletterig nivo laat zien dan ze blijkt te hebben. Dus: geen wederzijdse weerlegging.

* Over Cas: 'Cas kent heel veel letters ik denk dat hij wel leesrijp is'.

Commentaar. Cas kent inderdaad heel veel letters. In zijn schrijfproef komen er achttien moeiteloos op papier; zie §3.2. Verder blijkt hij daar meerletterig leesrijp te zijn. Dus: wederzijdse bevestiging.

* Over Debbie: 'Debbie is nog niet toe aan lezen. Ze kent nog maar weinig letters.

Commentaar. In §3.3 blijkt ze maar twee letters te kennen: 's' en 'e' of 'd'. Ze is volstrekt niet leesrijp. Dus: wederzijdse bevestiging.

* Over Dees: 'Dees kent veel letters. Ik denk dat hij best zou kunnen leren lezen'.

Commentaar. In §3.4 blijkt Dees' letterkennis aan de magere kant te zijn: van 'floris' kent hij 'f', 'l' en 'i' niet en twee van de drie letters die ik hem vraag te schrijven, kent hij ook niet, namelijk 't' en 'n'. Hij is niet leesrijp. Dus: wederzijdse weerlegging.

* Over Demi: 'Demi kent veel letters en heeft de cito super goed gedaan. Door haar gedrag schat je haar vaak iets lager in. Ze piept snel en heeft niet altijd zin om aan het werk te gaan. Ik denk toch dat ze wel leesrijp is'.

Commentaar. In §3.5 blijkt Demi inderdaad veel letters te kennen. Ze is drieletterig leesrijp en dat kan haar leerkrachten een leesrijpe indruk geven in de zin van 'ze kan gaan leren lezen'. Dus: geen wederzijdse weerlegging als we het onderscheid tussen drieletterig en vierletterig meenemen.

* Over Floris: 'Is echt nog niet leesrijp'.

Commentaar. In §3.6 blijkt Floris niet leesrijp te zijn. Dus: wederzijdse bevestiging.

* Over Jesper: 'Denk dat Jesper leesrijp is. Is soms wel erg onrustig en weet niet of dit hem in de weg zit'.

Commentaar. In §3.7 blijkt Jesper niet leesrijp te zijn. Dus: wederzijdse weerlegging.

* Over Lisa: 'Lisa is nog niet leesrijp'.

Commentaar. In §3.8 blijkt Lisa niet leesrijp te zijn. Dus: wederzijdse bevestiging.

* Over Mikkel: 'Denk nog niet leesrijp'.

Commentaar. In §3.9 blijkt Mikkel drieletterig leesrijp te zijn, maar in de schrijfproef blijkt hij een zeer onvaste kennis te hebben van de klankwaardes van de letters. Dus: geen wederzijdse weerlegging als we het onderscheid drieletterig-vierletterig meenemen.
* Over Noery: 'Niet leesrijp'.

Commentaar. In §3.10 blijkt Noery niet leesrijp te zijn. Dus: wederzijdse bevestiging.

* Over Rosa: 'Denk nog niet leesrijp, maar twijfel wel'.

Commentaar. In §3.11 blijkt Rosa niet leesrijp te zijn. Dus: wederzijdse bevestiging.

* Over Siemen: 'Denk dat Siemen wel leesrijp is'.

Commentaar. In §3.12 blijkt Siemen meerletterig leesrijp te zijn. Dus: wederzijdse bevestiging.

* Over Teun: 'Teun kan al heel goed lezen. Leest in de klas al hele boekjes'.

Commentaar. In §3.13 blijkt Teun meerletterig leesrijp te zijn. Dus: wederzijdse bevestiging.

* Over Toon: 'Denk dat hij nog niet leesrijp is, maar hij kent wel veel letters'.

Commentaar. In §3.14 blijkt Toon 16 letters te kennen en meerletterig leesrijp te zijn al is er bij het lezen van 'snel' nog een fase-13-restant. Dus: geen wederzijdse weerlegging.

Alles bij elkaar konden we twee keer besluiten tot 'wederzijdse weerlegging' (Dees, Jesper), vier keer tot 'geen wederzijdse bevestiging' (Bo, Demi, Mikkel, Toon) en acht keer tot 'wederzijdse bevestiging' (de andere acht kinderen). Omdat het vrijwel zeker is de leerkrachten deels andere definities hanteren van leesrijpheid dan ik aangezien ze mijn tweedeling naar drieletterig en vierletterig niet kennen, kunnen hier niet al te veel conclusies aan verbonden worden.

De enige conclusie die ik zou willen trekken is dat de verschillen tussen de reacties van de leerkrachten en de uitkomsten van de leesrijpheidstoets minder groot zijn dan die tussen hun reacties en de uitkomsten van de Citotaaltoets. Zie hun inschattingen van Cas en Debbie hiernaast: ze zijn in overeenstemming met de bepaling van de leesrijpheidstoets, terwijl ze in de Citotaaltoets beiden een C krijgen.

7 Slot

De leesrijpheidstoets is een goed instrument om leesrijpheid mee te bepalen omdat hij een toepassing is van een houdbaar gebleken psychologische theorie (§2-3). De Citotaaltoets is geen goed meetinstrument vanwege zijn methodologische achtergrond (§4.2), ook niet voor leesrijpheid (§4.1,3,4 en §5). De inschattingen van de leerkrachten van de veertien proefpersonen zijn meer in overeenstemming met de resultaten van de leesrijpheidstoets dan met die van de Citotaaltoets (§6).

De Cotan ('Commissie testaangelegenheden Nederland') oordeelt positief over een versie van de Citotaaltoets; zie het begin van §5.2.34 Deze positieve beoordeling en onze beoordeling 'geen goed meetinstrument' kunnen niet allebei houdbaar zijn. Ik zie de reactie van de Cotan en andere psychometristen graag tegemoet.

Met 94 stemmen vóór en 56 stemmen tegen nam de Tweede Kamer op 5 november 2013 motie 33.750-VIII, nr.27 aan. Daarin verzoekt de Kamer de regering de inspectie op te dragen het al dan niet afnemen van een 'landelijk genormeerde kleutertoets' (dus ook de Citotaaltoets) niet meer te gebruiken om een school te beoordelen.

Ik hoop van harte dat de Tweede Kamer deze lijn zal doortrekken en zal besluiten tot een totaal verbod op het afnemen van tests in het onderwijs.

Ik wil verbindend eindigen. Zoals in de leesrijpheidstoets het (denk)proces van het kind centraal staat, zo dient dat in het hele onderwijs centraal te staan. Als het Cito, de Cotan en andere psychometristen deze weg mee op willen gaan, zullen ze binnen het toetsen als vanzelf weggroeien van tests als de Citotaaltoets en toegroeien naar proeven als in de taalrijpheidstoets. Lansink (van de verantwoording; begin van §5.2) kan zich daar kennelijk helemaal in vinden: 'Stel tijdens de uitvoering van de verrijkingsactiviteiten het (denk)proces centraal en maak het resultaat daaraan ondergeschikt'.

Samenvatting

Dit onderzoek analyseert de resultaten van de Citotaaltoets en hun relatie tot leesrijpheid. Scores worden gepresenteerd in sectie 5.1, waarbij de relevantie voor leesrijpheid wordt besproken. Echter, de totaalscore blijkt geen goede indicator te zijn. Sectie 5.2 vergelijkt totaalscores met leesrijpheidstestresultaten en toont weinig consistentie. Sectie 5.3 onderzoekt geletterdheidsscores en hun verband met leesrijpheid, waarbij ook geen betrouwbare indicatie wordt gevonden. De Citotaaltoets wordt theoretisch en methodologisch ontoereikend bevonden. De slotconclusie is tweeledig: de toets is ongeschikt voor leesrijpheid vanuit ontwikkelingspsychologisch en meettheoretisch perspectief. Kanttekeningen zoals proefpersonen en nauwkeurigheid worden weerlegd. Leerkrachten' inschattingen tonen meer overeenkomst met leesrijpheidstoetsresultaten dan met Citotaaltoetsresultaten, wat pleit voor een heroverweging van het gebruik van dergelijke tests in het onderwijs, met focus op het kind's (denk)proces.

Heb je vragen over dit thema? Stel ze in de onderwijs community binnen de Wij-leren.nl Academie!