Deel 2 Leesrijpheid: analyse van de toets Taal voor Kleuters

Ewald Vervaet

Ontwikkelingspsycholoog en docent bij Stichting Histos

Geplaatst op 1 juni 2015

Dit is het tweede paneel van een drieluik

4 De Citotaaltoets

Het Cito heeft over de theoretische achtergrond van de Citotaaltoets verschillende wetenschappelijke verantwoordingen uitgebracht. Wij gebruiken de meest recente versie, namelijk die van 2012.10

We staan achtereenvolgens stil bij:

de gedachtes over de ontwikkeling tot geletterdheid achter de Citotaaltoets (§4.1);
de psychometrische vóóronderstellingen erachter (§4.2);
de meetpretentie ervan (§4.3);
de opgaven ervan (§4.4).11.

De verantwoording bespreekt de meetpretentie vóór de theoretische inkadering. Ik keer die volgorde dus om. Dat doe ik omdat het me juister lijkt de inhoud van een toets en de meetwijze eerst te bespreken en dan pas de pretentie die men van zo'n toets mag hebben.

4.1 De ontwikkeling tot geletterdheid

We bespreken dit onderwerp in drie subparagrafen.

A. Citotaaltoets en taalontwikkeling in haar totaliteit

De verantwoording kadert de Citotaaltoets in in de taalontwikkeling in haar totaliteit.12 Eerst verwerft het kind het 'begrijpen van gesproken taal (luisteren)' en het 'zelf produceren van taal (spreken)'. 'Later, als het kind naar school gaat, ontwikkelen deze mondelinge taalvaardigheden zich steeds verder en komen ook de schriftelijke taalvaardigheden erbij'. De verantwoording maakt de volgende definities van anderen dan ook tot de hare: 'Taalontwikkeling is de groei of toename in communicatieve competentie op het gebied van luisteren, spreken, lezen en schrijven en de reflectie op deze vaardigheden in de zin van taalbewustzijn of taalbeschouwing' en 'Taalvaardigheid kan gedefinieerd worden als het vermogen tot luisteren, spreken, lezen en schrijven'. Daarom zou gesproken taal ook de basis voor geletterdheid zijn: '[D]e mondelinge taalvaardigheid is de basis voor de ontwikkeling van de schriftelijke taalvaardigheid'.

Bespreking. De verantwoording schetst eerst de 'ontwikkeling van de mondelinge taalvaardigheid'. We laten die rusten omdat ze in essentie juist is, maar er niet toe doet. De aanname dat lezen en schrijven taalvaardigheden zijn, is namelijk niet houdbaar. Slechts luisteren en spreken zijn taalvaardigheden, terwijl lezen en schrijven ruimtelijke vaardigheden zijn, die betrekking hebben op taal. Kort en goed: taal is klank; geletterdheid is het omzetten van klanken in figuurtjes (schrijven) en van figuurtjes in klanken (lezen).

Laten we vier figuurtjes nemen: 'F', '6', '♪' en 'Λ'. Alleen 'F' staat in het Nederlands voor een klank, namelijk voor /f/ zoals twee keer in /fuif/. De andere figuurtjes staan voor een heel woord, namelijk /zes/ in verband met een bepaalde hoeveelheid, voor de hoogte en duur van een toon (indien het in een notenbalk staat met een tempoaanduiding erbij) respectievelijk voor een klank in een andere taal, namelijk /l/ in het Grieks (zoals twee keer in het Nederlandse woord 'lol').

De theoretische basis van de Citotaaltoets schiet dus per definitie tekort als meetinstrument om leesrijpheid te bepalen: in de mate dat hij ook mondelinge vaardigheden meet, meet hij op het ontwikkelingspsychologische domein 'lezen' iets oneigenlijks; in de mate dat hij het ruimtelijke/figurale niet meet, blijft iets wezenlijks van geletterdheid achterwege.

B. De drie fasen van de verantwoording

Het tekortschietende dat we in subparagraaf A vaststellen, komt nog sterker naar voren in de schets van de 'ontwikkeling tot geletterdheid (schriftelijke taalvaardigheid)'. De verantwoording onderscheidt daar drie fasen in. Wij onderscheiden tussen het fasebegrip van de verantwoording en het fasebegrip van §2.1. Zie verder subparagraaf C2.

Fase 1 van de verantwoording is de fase van de ontluikende geletterdheid (0;0-4;0). '[Het kind] verwerft in deze periode de basisprincipes van de taal: luisteren, spreken en communiceren'. De verantwoording vervolgt: 'Deze mondelinge taalvaardigheden vormen de basis voor de latere ontwikkeling van de schriftelijke vaardigheden'. In deze fase 'komt het kind [...] in aanraking met geschreven taal': in het bekijken van prentenboeken, in het voorlezen, in het zien van 'letters of woorden in boeken, tijdschriften en kranten of op borden en logo's'. Dit alles zou sommige kinderen dermate boeien dat ze ook schriftelijk gaan communiceren: 'Sommige kinderen worden hierdoor geïnspireerd om zelf ook schriftelijk te communiceren met anderen. Zij doen dat op hun geheel eigen manier, bijvoorbeeld met tekeningen of eigen bedachte logo's'.

Bespreking. In de vorige alinea zitten ten minste vier gedachtes die niet houdbaar zijn.

a. Dat mondelinge vaardigheden de basis vormen voor schriftelijke vaardigheden, is niet houdbaar; zie A.
b. Dat het kind in deze fase met geschreven taal in aanraking komt, is in het Westen over het algemeen juist, maar het is beslist niet houdbaar om er een vorm van geletterdheid ('ontluikende geletterdheid') in te zien. Hier zit de empiristische aanname achter dat kennis via onze zintuigen binnen zou komen. Als die aanname houdbaar zou zijn, zijn het vrijvormige schrijven, het eigenfiguurlijke schrijven en het spiegelbeeldige schrijven van §2.1 volstrekt onverklaarbaar: zulke vrije krabbels, zulke terugkerende figuren zonder klank-letter-overeenkomst en zulke gespiegelde en verwisselde lettertekens ziet het kind vrijwel nooit! En het zien van conventionele lettertekens in kranten, op borden, enzovoort brengt kennelijk niet onmiddellijk conventionele lettertekens als 'N' en 'e' tot stand, zoals we in §3 keer op keer moesten vaststellen: Bo (§3.1) heeft de 'y', de '6' en de '9' zelden of nooit gespiegeld gezien, Dees (§3.4) 'Floris' zelden of nooit als FOLRIS, Noery (§3.10) de '9' zelden of nooit als vertikale streep met rechts daarvan vijf horizontale strepen, enzovoort. Wat via de zintuigen in het menselijke brein binnenkomt, is geen kennis maar zijn prikkels. Die prikkels worden vanaf ongeveer 3;0 opgenomen in een bepaalde psychologische structuur: gerichte concreet-feitelijke verbanden, wederzijdse concreet-feitelijke verbanden, onomkeerbare abstract-logi-sche verbanden respectievelijk omkeerbare abstract-logische verbanden; zie §2.1. Bo spiegelt die letter en die cijfers en Dees verwisselt die letters vanuit de onomkeerbare abstract-logische verbanden van fase 13, terwijl Noery dat eigen cijfer vormt vanuit de wederzijdse concreet-feitelijke verbanden van fase 12.
c. Vanaf onze fase 5 (gemiddeld 1;0-1;3) kan een kind afbeeldingen herkennen als afbeeldingen.13 Het kan dan in prentenboeken kijken. Dat heeft echter niets met geletterdheid te maken. Sterker nog, het kind in onze fasen 5-12 (samen: gemiddeld 1;0-4;6) ziet in letters concrete afbeeldingen: in 'Y' een molentje; in 'E' een kammetje of een hekje; in 'P' een zonnebloem; enzovoort. Kortom, vanaf onze fase 5 kan een kind prentenboeken bekijken ook als daar geen enkele letter in staat en hebben prentenboeken ook om die reden niets met geletterdheid te maken; en tot en met onze fase 12 ziet het in letters concrete voorwerpen en allerminst klanken zodat in onze fasen 5-12 lettertekens niets aan zijn geletterdheid bijdragen omdat de kern daarvan nu eenmaal de klank-letter-overeenkomst is.
d. Dat sommige kinderen door het zien van letters en woorden geïnspireerd zouden worden om schriftelijk te gaan communiceren onder meer met tekeningen of met eigen bedachte logo's, is om ten minste drie redenen niet houdbaar. (i) Een tekening kan een communicatief middel zijn, bijvoorbeeld om iemand een route of een natuurkundige theorie uit te leggen, maar hoeft dat niet te zijn: als een kind in onze fase 13 een auto tekent, dan is dat doorgaans louter om zichzelf te plezieren en het product eventueel aan anderen te laten zien, maar niet om te communiceren dat dat een auto is of wat dan ook. (ii) Niet slechts 'sommige kinderen' maar alle kinderen doorlopen onze fase van het eigenfiguurlijke schrijven; zie §2.1. (iii) Een kind dat eigenfiguurlijk schrijft, doet dat niet omdat het door letters en woorden is 'geïnspireerd' maar omdat het de prikkels die van letters en woorden bij hem binnenkomen, interpreteert als zich herhalende figuren, waarvan het geen idee heeft dat elk voor een bepaalde klank staat.

Fase 2 van de verantwoording is de fase van de beginnende geletterdheid (groepen 1-3 van de basisschool). '[Het kind] leert de verschillende functies die taal heeft te herkennen'. Ook 'ontwikkelt het inzicht in het verband tussen gesproken en geschreven taal. Het kind gaat het principe van het alfabetische schrift ontdekken'. Tot slot 'maakt het zich [...] de elementaire leeshandeling eigen': het 'leert [...] betekenis te verlenen aan een verzameling tekens (lezen)' en 'om zijn eigen gedachtes op papier te zetten en zo zelf betekenis weer te even in tekens (schrijven)'.

Bespreking. Hier zitten enkele gedachtes in, die houdbaar zijn, maar ook enkele die het niet zijn.

a. De zin 'Het kind leert de verschillende functies die taal heeft te herkennen' is vanuit de optiek 'taal is klank' niet duidelijk: taal heeft maar één functie, namelijk het overbrengen van gedachtes, dus communiceren. Maar waarschijnlijk wordt vanuit de optiek 'geletterdheid is een vorm van taalvaardigheid' wat anders bedoeld. Dat andere is dus onhoudbaar; zie nogmaals subparagraaf A.
b. Het is juist dat het kind doorgaans ergens in de groepen 1-3 het verband tussen gesproken en geschreven taal begrijpt en dus het alfabetische beginsel ontdekt. Dat gebeurt in onze fase 13.
c. Eveneens ergens in de groepen 1-3 maakt het kind zich het lezen en het schrijven eigen. Dat gebeurt echter in een andere psychologische fase dan het ontdekken van het alfabetische beginsel, namelijk in onze fase 14.

Fase 3 van de verantwoording is de fase van de gevorderde geletterdheid (groep 4 en hoger). 'Het kind leert steeds sneller woorden te herkennen, het leesproces wordt geautomatiseerd'. Ook ontstaan het begrijpende lezen en het studerende lezen: '[Het kind gaat] zijn aandacht steeds meer richten op de betekenis van een tekst' en '[Het kind leert] hoe je informatie uit teksten kunt halen. Het leert leesstrategieën toe te passen'. Tot slot ontwikkelt zich het schrijven verder: '[Het kind leert] goed schriftelijk te communiceren met anderen door informatie en eigen ervaringen op te schrijven'.

Bespreking. Ook hier zitten enkele gedachtes in, die houdbaar zijn, en enkele die het niet zijn.

a. Het is juist dat het automatiseringproces volgt op het eerste lezen in fase 2 van de verantwoording. Dat automatiseren gebeurt echter in dezelfde psychologische fase als het leren lezen (en schrijven), namelijk in onze fase 14, en niet in een andere fase zoals de verantwoording stelt, namelijk in haar fase 3.
b. Het begrijpende lezen ontstaat tegelijk met het technisch lezen, maar dan moet het kind wel de gelegenheid krijgen om zich in zijn tempo het lezen eigen te maken. In ontdekkend leren lezen14 is daar volop gelegenheid toe omdat ook in het lezen van zinnen van twee, drie, vier, vijf en meer woorden het kind niet naar het volgende nivo wordt geforceerd maar omgekeerd de leerkracht bij de ontwikkeling van het kind aansluit. Bovendien tekent het kind dat ontdekkend leert lezen, zes van de zinnen in de oefening waarin zinnen worden gelezen. Dan moet het de zinnen waaruit het zijn keuze maakt, wel eerst begrepen hebben. In de meeste leesmethodes wordt hieraan voorbijgegaan. Tja, dan ijlt het begrijpende lezen stelselmatig achter bij het technische lezen. Dat alles pleit echter niet voor het bestaan van een aparte fase in de psychologische ontwikkeling, in dit geval van het lezen.
c. Het is ongetwijfeld waar dat er ook nog het studerende lezen is. Dan leest een kind een tekst met het oog op een betoog dat het moet schrijven of vertellen. In welke psychologische fase het studerende lezen ontstaat, weet ik niet, maar het is stellig niet in onze fase 14. Binnen fase 3 van de verantwoording dient dus onderscheiden te worden naar ten minste twee subfasen.

Kortom, zoals te verwachten valt op grond van de niet-houdbare insteek dat schrijven en lezen taalvaardigheden zouden zijn (subparagraaf A), vertonen de fasen van de verantwoording belangrijke onjuistheden en onvolkomenheden:

veel erin heeft niets met lezen van doen;
sommige vermogens staan ten onrechte in één fase;
maar andere vermogens staan ten onrechte in twee verschillende fasen.

C. Algemene opmerkingen

Dan zijn er tot slot nog drie algemene opmerkingen bij de fasen van de verantwoording.

C1. De verantwoording beschouwt haar drie fasen samen als een theorie.

Weliswaar doet ze dat niet in of onmiddellijk rond de uiteenzetting van de drie fasen (op p.14v), maar op p.12 blijkt het onderwerp 'Ontwikkeling tot geletterdheid' te vallen onder de paragraaf die 'Theoretische inkadering' heet. Enkele regels onder de kop 'Theoretische inkadering' staat dat 'De basis voor de inhoud van de [Citotaaltoets] wordt gevormd door theorieën over de taalontwikkeling (luisteren en spreken) en de ontwikkeling tot geletterdheid (lezen en schrijven) bij kleuters [...]' (cursiveringen toegevoegd).

Welnu, een theorie dient altijd verklarend van aard te zijn. Zo verklaart Newtons zwaartekrachttheorie verschijnselen als de vrije val, de getijden en het feit dat de maan rond de aarde blijft bewegen (in plaats van er zich vanaf te bewegen). Mendeleevs theorie van het periodieke systeem verklaart verschijnselen als de overeenkomstige reacties van het drietal elementen lithium, natrium en kalium, van het viertal elementen ijzer, kobalt, nikkel en koper, enzovoort.15 Piagets theorie van de cognitieve ontwikkeling verklaart verschijnselen als het niet terugzoeken van een verdwenen voorwerp vóór gemiddeld 0;8, het menen dat * * * * * niet even veel sterren is als ***** rond 5;6, enzovoort. De theorie van §2.1, die Piagets theorie uitbreidt, verklaart vier verschillende soorten schrijven die er tussen gemiddeld 3;0 en gemiddeld 8;6 blijken te zijn, en twee verschillende soorten lezen dier tussen gemiddeld 4;6 en 8;6 blijken te zijn. Tot verklaren is in de verantwoording zelfs geen aanzet, ook niet bij de auteurs aan wie zij haar drie fasen ontleent.

C2. De verantwoording spreekt in haar beschrijving van de ontwikkeling tot geletterdheid van fasen.

(i) Voor het verwerven van de moedertaal zou vaak een bepaalde 'fase-indeling' worden gehanteerd (p.14). Wie echter een ontwikkelingstheorie in verklarende zin bedoelt, zal fasen nooit als een indeling opvatten maar altijd als psychologische structuren: 'fase 11' is een verkorte zegswijze voor 'structuur van gerichte concreet-feitelijke verbanden', 'fase 12' voor 'structuur van wederzijdse concreet-feitelijke verbanden', enzovoort.

(ii) De term 'fase' komt in de verantwoording bij de schets van subparagraaf B maar liefst acht keer voor. In de hele verantwoording komt de term 'fase' volgens mijn woordzoeker ten minste 43 keer voor. Als men die alle 43 naast elkaar houdt, blijkt dat het woord 'fase' in verschillende betekenissen wordt gebruikt. Op p.15 neigt het woord 'fase' naar de betekenis 'periode': '[De fase van beginnende geletterdheid] betreft de periode van groep 1 tot en met 3'. Op p.30 neigt het woord 'fase' naar de betekenis 'stap': 'In het ontwikkelingsproces van toetsen zijn normaliter achtereenvolgens de volgende fasen te onderscheiden: domeinbeschrijving, itemconstructie, proefafname/kalibratieonderzoek [...]'.16 Op p.30 en p.37 staan nog voorbeelden van het woord 'fase' in de betekenis 'stap'.

In feite zijn de drie geletterdheidsfasen van de verantwoording slechts verzamelingen van opvallende verschijnselen, die onverklaard blijven en, als men ze op hun structuur onderzoekt (dus vanuit verklarende optiek zoals in §2.1 in het kort gebeurt), niet bij elkaar blijken te horen. We schetsen dat voor elk van haar drie fasen met één voorbeeld.

Voorbeeld 1. In fase 1, van de ontluikende geletterd-heid, worden het kijken in prentenboeken en het eigenfiguurlijke schrijven bijeengenomen, terwijl ze een heel verschillende psychologische structuur hebben, namelijk 'aandachtscontact' (fase 5) respectievelijk 'wederzijdse concreet-feitelijke verbanden' (fase 12).
Voorbeeld 2. In fase 2, van de beginnende geletterdheid, worden het ontdekken van het alfabetische beginsel en het eerste leren lezen bijeengenomen, terwijl ze een verschillende psychologische structuur hebben, namelijk 'onomkeerbare abstract-logische verbanden' (fase 13) respectievelijk 'omkeerbare abstract-logische verbanden' (fase 14).
Voorbeeld 3. In fase 3, van de gevorderde geletterdheid, worden geautomatiseerd technisch lezen en studerend lezen bijeengenomen, terwijl ze een verschillende psychologische structuur hebben, namelijk 'omkeerbaar abstract-logische verbanden' (fase 14) respectievelijk de structuur van een fase die na die fase 14 komt.

Omgekeerd: verschijnselen met dezelfde psychologisch structuur worden in de verantwoording in verschillende fasen geplaatst. Hét voorbeeld is dat het eerste leren lezen in fase 2 wordt geplaatst en het automatische lezen in fase 3, terwijl beide de psychologische structuur 'omkeerbaar abstract-logische verbanden' hebben. Het enige niet-principiële verschil is dat het tweede verschijnsel een automatisering is van het eerste.

C3. De verantwoording is zich bewust van het feit dat elk kind een ontwikkeling op zijn eigen manier doorloopt:

'Kinderen verschillen in het tempo waarin ze zich ontwikkelen en ook in de kwaliteit van de ontwikkeling op de verschillende aspecten'

en 'Kinderen kunnen [...] verschillen in de mate waarin ze een tussendoel beheersen (het niveau) én in het tijdsbestek dat zij nodig hebben om een tussendoel te bereiken (het tempo)'.

Echter, in de schetsen van de ontwikkelingen van wat de verantwoording als taalvaardigheden ziet, relativeert ze haar aanduidingen met kalenderleeftijden of schoolgroepen niet. Bij de ontwikkeling van de mondelinge taalvaardigheid worden immers als grenzen aangegeven: '0-12 maanden', '1-2,5 jaar', '2,5-5 jaar' en '5 jaar en ouder'. En bij die van de schriftelijke taalvaardigheid zouden de grenzen zijn: 'leeftijd van nul tot vier jaar' (ons '0;0-4;0'), 'periode van groep 1 tot en met 3' (ons 'groepen 1-3 van de basisschool') en 'vanaf groep 4' (ons 'groep 4 en hoger '); zie subparagraaf B.

Kortom, weliswaar doet de verantwoording recht aan het eigen tempo waarin elk kind een ontwikkeling doorloopt, maar ze brengt dat in de presentaties van de mondelinge en van de schriftelijke taalvaardigheid niet tot uitdrukking. Dat had heel gemakkelijk gekund met het steeds toevoegen van een woord als 'gemiddeld'.

"De conclusie kan niet anders luiden dan dat de theoretische achtergrond van de Citotaaltoets zeer te kort schiet".

In subparagraaf A blijkt dat geletterdheid ten onrechte wordt opgevat als een onderdeel van de taalontwikkeling zodat voorbij wordt gezien aan het ruimtelijke aspect van lezen en schrijven én aan het omkeerbare in het psychologische functioneren, dat een noodzakelijke voorwaarde is om afzonderlijke klanken van een woord samen te kunnen stellen tot één woord.
In subparagraaf B blijkt dat de fasen in de ontwikkeling van de geletterdheid geen psychologische fasen zijn maar een onjuiste en onvolkomen rubricering van een aantal verschijnselen die met geletterdheid te maken hebben (zoals de klank-letter-overeenstemming) dan wel er ten onrechte mee in verband worden gebracht (zoals het bekijken van prentenboeken).
En in subparagraaf C blijkt de verantwoording geen theorie te zijn in de verklarende zin van het woord, en blijken haar fasen geen fasen te zijn in de psychologische, structurele zin van het woord en wel kalenderleeftijdfasen en/of schoolgroepfasen.

4.2 Psychometrische vóóronderstellingen

We bespreken de twee psychometrische onderwerpen in de verantwoording elk in één subparagraaf.17

D. Vereisten voor een goede opgavenbank

De verantwoording stelt dat een 'deugdelijke en psychometrisch goed gefundeerde opgavenbank' aan zeven vereisten moet voldoen. We lopen ze alle zeven langs.

D1. Het algemene uitgangspunt van de Citotaaltoets is dat 'de vaardigheid taal kan worden opgevat als een unidimensionaal continuüm'. Dat houdt in dat een leerling voorgesteld kan worden als een getal op de rechte lijn. Dat wil zeggen, 'Het getal drukt de mate van taalvaardigheid uit, waarbij een groter getal wijst op een grotere taalvaardigheid'. De Citotaaltoets tracht dan ook 'de plaats van de leerling op dit continuüm zo nauwkeurig mogelijk te bepalen'.18

Bespreking. Deze vereiste is in strijd met wat de verantwoording eerder over fasen heeft geschreven. Immers, de ontwikkeling van de geletterdheid is per definitie discontinu vanwege haar beschrijving met fasen (§4.1). Dat wil zeggen, ondanks alle onjuistheden en onvolkomenheden aan die optiek is ook volgens haar een vermogen van een volgende fase er niet zomaar en ineens. In haar fase 1 bijvoorbeeld ontbreekt de klank-letter-overeenkomst, terwijl die er wel in haar fase 2 is. En terwijl het begrijpende en het studerende lezen er niet in haar fase 2 zijn, zijn die er wel in haar fase 3.

De vereiste van het unidimensionale continuüm houdt in dat een kind al vanaf geboorte een beetje in prentenboeken kijkt en dat daarna alsmaar meer gaat doen, dat een kind al vanaf geboorte een beetje begrijpt dat er klank-letter-overeenkomst is en dat dat daarna alsmaar meer gaat doen, enzovoort. Welnu, een vermogen kan er niet én vanaf geboorte zijn en daarna alsmaar toenemen (al dan niet lineair) én er tot zeker ogenblik niet zijn en dan als iets nieuws ontstaan.

Omdat de Citotaaltoets aan de vereiste van het unidimensionale continuüm voldoet, ondergraaft die vereiste dus al van begin af de mogelijkheid om er iets van de ontwikkelingslijn in de geletterdheid in te zien te krijgen zoals in de verantwoording is verwoord; zie §4.1, met name subparagraaf B. Dat is niet alleen fataal voor de Citotaaltoets als mogelijk geldig en betrouwbaar meetinstrument, maar het ondermijnt ook de mogelijkheid om met deze toets iets van ontwikkeling te zien te krijgen. Zo kan de met feiten onderbouwde ontwikkelingslijn van §2.1, die haar geldigheid andermaal heeft bewezen bij de veertien proefpersonen van §3, met de Citotaaltoets niet eens in beeld komen! Op het ontwikkelingsdomein schrijven loopt er namelijk geen continuüm van vrijvormig (fase 11) via eigenfiguurlijk (fase 12) en spiegelbeeldig (fase 13) naar conventioneel (fase 14). En zo loopt er op het ontwikkelingsdomein lezen ook geen continuüm van etiket- (fase 11) via fantasie- (fase 12) en losletterig en geheel-voor-geheel- (fase 13) naar conventioneel (fase 14).19

D2. De vaardigheid die de Citotaaltoets geacht wordt te meten, is niet direct meetbaar. De reacties op de opgaven van de toets 'worden beschouwd als indicatoren van de vaardigheid'. Om die reden wordt de vaardigheid zelf 'latent' genoemd.

Bespreking. De aanname van de latente vaardigheid zit ook in de leesrijpheidstoets: de vaardigheid 'leesrijpheid' is niet direct waarneembaar, maar iemands schrijfsels en leeswijzen van de toetswoorden worden beschouwd als indicatoren van leesrijpheid.

'Latente vaardigheid' is dus geen typisch psychometrische aanname, maar een algemene ontwikkelingspsychologische aanname. Wel problematisch aan de Citotaaltoets zijn twee zaken. In de eerste plaats hebben de opgaven van de Citotaaltoets een gebrekkige theoretische dekking indien ze daadwerkelijk uit de optiek van §4.1 zijn afgeleid; zie de subparagrafen A en B van §4.1. De leesrijpheidstoets daarentegen heeft een ontwikkelingspsychologische achtergrond die verklarend is én feitelijk houdbaar is. In de tweede plaats is er de psychometrische methode als zodanig; zie D1, D4 en D5.

D3. De opgaven in de Citotaaltoets hebben geen gelijke moeilijkheidsgraad. In de item-respons-theorie van de psychometrie komen de vaardigheid en de moeilijkheidsgraden van de opgaven op één schaal te liggen.

Bespreking. We gaan hier niet nader op in omdat de item-respons-theorie een verfijning is van de psychometrische methode. En aangezien we menen dat in §4.2 als geheel is aangetoond dat de psychometrische methode zónder item-respons-theorie niet houdbaar is, geldt dat ook voor de psychometrische methode mét.

D4. In de item-respons-theorie 'wordt een kansmodel gebruikt: hoe groter de vaardigheid, des te groter de kans dat een item juist wordt beantwoord'.16 In die lijn wordt de moeilijkheidsgraad van een opgave gedefinieerd als de 'mate van vaardigheid die nodig is om met een kans van precies een half een juist antwoord te kunnen produceren'.

Bespreking. In de Citotaaltoets zitten vanwege zijn meerkeuzevorm allerlei kanstheoretische aspecten, zoals het gokken van de juiste reactie en de aanname dat alle kinderen met een bepaalde score in gelijke mate gokken en daarmee succes hebben om voor dat gokken te kunnen corrigeren. Via de item-respons-theorie komen er dus kanstheoretische aspecten bij. Bekeken vanuit de psychologische ontwikkeling van het kind zijn kansen echter niet relevant. Zo heeft Rosa (§3.11) niet een bepaalde kans om op het nivo van fase 13 te schrijven: in afbeelding 18 schrijft ze op het nivo van fase 13.

Omgekeerd, althans in de opgaven 53 en 59 van de Citotaaltoets zitten allerlei oneigenlijke kansaspecten.

In opgave 53 ziet het kind het woord 'boek', het cijfer '7' en de letter 'h', terwijl de leerkracht zegt: 'Hier zie je een cijfer, een letter en een woord. Zet een streep onder de letter'. Kinderen met een 'h' in hun naam, zoals Phia en Chris, hebben uiteraard een grotere kans om die opgave goed te maken dan kinderen zonder een 'h' in hun naam. Hetzelfde geldt voor kinderen die andere woorden/namen met een 'h' erin kennen – in de schrijfsels van §3 komt dit niet voor. Tot slot zijn er nog fase-13-kinderen die de letter 'n' min of meer als 'h' schrijven en omgekeerd in 'h' een 'n' zien. De Citotaaltoets kan van dit feit geen rekenschap geven terwijl het voor geletterdheid een relevant gegeven is.

In opgave 59 ziet het kind het cijfer '8', de letter 'b' en het woord 'bal' en zegt de leerkracht: 'Hier zie je een cijfer, een letter en een woord. Zet een streep onder het cijfer'. Weliswaar schrijft Bo haar naam als 'Bo' en niet als 'bo', maar de kans dat ze de 'b' kent en dus weet dat 'b' niet de juiste reactie is, is groter dan bij de andere kinderen zonder een 'b' in hun naam of in de namen van een broer, zus, neef en anderen. Cas schrijft echter wel 'bo'. Dus, alleen al omdat hij een Bo kent en haar naam kan schrijven, heeft hij een grotere kans om opgave 59 goed te maken. Verder, Dees spiegelt 'p' tot 'b' (afbeelding 4). Hij heeft dus een grotere kans om opgave 59 goed te maken dan kinderen die 'pappa' schrijven zonder 'p' te spiegelen. Dát Dees spiegelt, meet de Citotoets echter niet en dat is toch echt relevanter dan of hij weet of '8', 'b' of 'bal' een cijfer is. Voorts schrijft Demi '6' als 'b' (afbeelding 6). Ze heeft dus een verhoogde kans om opgave 59 fout te beantwoorden, en dat terwijl in de schrijfproef heel duidelijk blijkt dat ze weet dat 'D', 'e' en dergelijke letters zijn en '1', '2' en dergelijke cijfers. Tot slot zijn er veel fase-13-kinderen die 'd' en/of 'q' tot 'b' spiegelen. Ook van dit relevante feit geeft de Citotaaltoets ten onrechte geen rekenschap.

Kortom, ook zonder item-respons-theorie heeft de Citotaaltoets vanwege zijn meerkeuzekarakter oneigenlijke kansaspecten. Die oneigenlijkheid wordt er door de item-respons-theorie niet minder op.
De leesrijpheidstoets daarentegen kent geen kans-aspecten: in de schrijfproef schrijft het kind letters die het kent, en in de leesproef bestaan de toetswoorden slechts uit zijn letters en geen andere. En een kind leest een toetswoord op het nivo van fase 13 of op dat van fase 14, zonder dat er een bepaalde kans is om het op het ene nivo te doen en een andere kans om het op het andere nivo te doen.

D5. De verantwoording geeft er rekenschap van dat de gedachtes van D1, D3 en D4 veronderstellingen zijn en dat 'we methoden zullen moeten bedenken om aan te tonen dat al die veronderstellingen deugdelijk zijn'. Dat aantonen zal langs de weg van de inferentiële statistiek gebeuren: 'Dit "aantonen" gebeurt met statistische gereedschappen'. Bovendien moeten de waarden van de moeilijkheidsgraden van de opgaven worden bepaald. Ook dat zal inferentieel-statistisch gaan: 'Dit gebeurt met een statistische schattingsmethode'. Beide zaken samen heten 'kalibratie of ijking'.

Bespreking. Elders20 is uitvoerig aangetoond dat de inferentiële statistiek als methode om tot geldige en betrouwbare kennis te komen, niet houdbaar is. In de kern van de zaak komt de kritiek op het volgende neer.

De grondveronderstelling is dat we fysieke maten van mensen, zoals armlengte en borstomvang, zouden kunnen opvatten als afwijkingen van hun gemiddelde dat zou staan voor de 'typische mens' (het huidige begrip 'gemiddelde mens').

Omdat er in de psychologie geen maat is waarmee intelligentie gemeten zou kunnen worden (zoals er in de exacte wetenschappen wel een maat is waarmee lengte gemeten kan worden), kunnen we daar de klokkromme van de meetfouttheorie van de exacte wetenschappen voor nemen; zie afbeelding 25.

Afbeelding 25. De klokkromme van de meetfouttheorie.

Feitelijk wordt een testmaat vastgesteld door een steekproef van proefpersonen te nemen en daar de betreffende opgaven aan voor te leggen. Bij 400 proefpersonen scoort de vierde beste 49% boven het gemiddelde. De proefpersoon op plaats 8 scoort 48% boven het gemiddelde. En zo terug via de proefpersoon op plaats 200 die gemiddeld scoort, tot de proefpersonen op de plaatsen 396 en 400 die 49% respectievelijk 50% onder het gemiddelde scoren.

In de klassieke testleer betekent dat het volgende. Stel dat er 120 opgaven zijn en dat de proefpersoon op plaats 200 63 opgaven goed heeft. Dan komt 63 opgaven op de maat overeen met het gemiddelde oftewel met een afwijking van 0% van het gemiddelde. Stel verder dat de proefpersoon met 75 goede opgaven op plaats 236 staat, dan komt hij overeen met (236/4=) 59% = 9% boven het gemiddelde. Stel ook dat de proefpersoon met 43 goede opgaven op plaats 140 staat, dan komt hij overeen met (140/4=) 35% = 15% onder het gemiddelde. Enzovoort.
De psychometrische aanname nu is dat elke proefpersoon buiten de steekproef met 0 opgaven goed, 50% onder het gemiddelde scoort. Evenzo komen 43 goede opgaven overeen met 15% onder het gemiddelde, 63 opgaven met het gemiddelde, 75 goede opgaven met 9% boven het gemiddelde en 120 goede opgaven met 50% boven het gemiddeld. Enzovoort.

In de meetfouttheorie van de exacte wetenschappen is de klokkromme een houdbare aanname. Ze geldt bijvoorbeeld bij het bepalen van de lengte van een mouw vanaf de oksel. Het is namelijk een feit dat als 25 personen de mouw opmeten, ze er niet allemaal hetzelfde getal melden. De getallen zijn bijvoorbeeld als in tabel 1.

   57,23   57,41   57,49   57,58   57,67
   57,27   57,44   57,50   57,59   57,68
   57,31   57,45   57,51   57,59   57,74
   57,35   57,47   57,54   57,61   57,76
   57,38   57,48   57,55   57,62   57,85
Tabel 1. De 25 waarden voor de lengte van een bepaalde mouw, gemeten vanaf de oksel, in centimeter. De waarden zijn gerangschikt van laag naar hoog.21

Hun gemiddelde is 57,53 cm. Daarvan kan men de meetnauwkeurigheid bepalen. Door allerlei factoren meten die 25 personen niet alle maal 57,53 cm: niet iedereen legt de mouw op dezelfde manier op een ondergrond; de 25 personen kiezen niet allemaal hetzelfde punt bij de oksel voor het ene uiteinde van de mouw; ze leggen de meetlat niet op exact dezelfde plaatsen bij wat ze voor de uiteinden van de mouw houden; ze zijn niet allemaal even wakker, even alert en even nauwgezet; ze hebben niet allemaal een even vaste hand; hun ogen zijn niet gelijk aan elkaar, waarbij lenzen en brilleglazen ook voor vertekeningen zorgen; de temperatuur fluctueert; de meetlat en de mouw hebben verschillende uitzettingscoëfficiënten zodat ze verschillend reageren op die temperatuurfluctuatie; de luchtvochtigheid varieert; enzovoort. En dat terwijl de mouw uiteraard slechts één lengte heeft indien men de temperatuur en andere omgevingsfactoren constant zou kunnen houden.

Bewezen nu is dat als de meetfouten talrijk zijn én klein zijn ten opzichte van de te meten waarde, we mogen aannemen dat het gemiddelde van de opgemeten waarden de werkelijke waarde het beste benadert én dat de meetfouten volgens de klokkromme van afbeelding 25, die uit de kansrekening afkomstig is, rond dat gemiddelde verdeeld zijn.

Ook kan worden bewezen dat voor de waarden van tabel 1 geldt dat 68% ervan tussen 57,377 en 57,683 liggen, 16% onder 57,377 en 16% boven 57,683. Dat interval geeft men doorgaans weer als '57,53 ± 0,153 cm'. Daarin is 57,53 het gemiddelde en noemt men 0,153 de standdaardafwijking s. De meetfouttheorie blijkt goed overeen te komen met de waarden in tabel 1: 4 waarden liggen onder 57,377 (16%), 18 waarden liggen tussen 57,377 en 57,683 (72%) en 3 waarden boven 57,683 (12%). De verhouding 16-72-12% komt dus goed overeen met de theoretische verhouding 16-68-16%.

Verder kan men de waarden van tabel 1 samenvatten, bijvoorbeeld op de manier van afbeelding 26. Daarin is het interval tussen de laagste waarde (57,23) en de hoogste waarde (57,85) in stukjes van 0,1 cm verdeeld. Onder 57,3 zitten twee waarden van tabel 1, namelijk 57,23 en 57,27; tussen 57,3 en 57,4 zitten drie waarden, namelijk 57,31, 57,35 en 57,38; enzovoort.

Afbeelding 26. Staafdiagram van tabel 1. De hoogte van een staaf staat voor het aantal meetwaarden in een bepaald onderinterval. Zo betekent de eerste staaf dat er 2 waarden tussen 57,2 en 57,3 zitten, namelijk 57,23 en 57,27. De tweede staaf betekent dat er 3 waarden tussen 57,3 en 57,4 zitten. Die aantallen komen tot uiting in de hoogtes van de staven: de tweede is anderhalf keer zo hoog als de eerste. Enzovoort.

Welnu, geen van de aannames in de meetfouttheorie gaan op voor meerkeuzetoetsen in het algemeen en voor de Citotaaltoets in het bijzonder, terwijl de psychometrie in naam begripsmatig aan de meetfouttheorie ontleend zou zijn. Terwijl er voor de lengte van de mouw wel één werkelijke waarde is, geldt met name dat er niet één werkelijke waarde voor 'taalvaardigheid' is, noch in de zin van de houdbare optiek van de leesrijpheidstoets (§2), noch in de zin van de onhoudbare optiek van de Citotaaltoets (§4.1).

In de leesrijpheidstoets zijn er wat het schrijven betreft tussen gemiddeld 3;0 en 8;6 vier kwalitatief verschillende wijzen: vrijvormig, eigenfiguurlijk, spiegelbeeldig en conventioneel – we verklaren die met de psychologische structuren van de fasen 11, 12, 13 respectievelijk 14. En zo zijn er ook vier kwalitatief verschillende vormen van lezen: etiket-, fantasie-, losletterig en conventioneel. Als men hierop de benadering van gemiddeldes en afwijkingen toepast, komt men vanuit de gedachte '13 is het gemiddelde van 12 en 14' op absurditeiten als 'spiegelbeeldig schrijven van fase 13 is het gemiddelde van eigenfiguurlijk schrijven van fase 12 en conventioneel schrijven van fase 14' en 'eigenfiguurlijk schrijven wijkt naar onderen evenveel van spiegelbeeldig schrijven af als conventioneel schrijven naar boven'.

Om het in termen van de schrijfsels van §3 te zeggen: Dees' spiegelbeeldige schrijven (afbeelding 4) is geen gemiddelde van de eigenfiguurlijke tekens in Mikkels en Noery's schrijfsels (afbeeldingen 14 en 16) en uw en mijn conventionele schrijven. De reden is dat Dees kennis heeft van de betreffende lettertekens en van hun klankwaarden, terwijl Mikkel en Noery nog gedeeltelijk in de veronderstelling verkeren dat ze zelf een schriftteken kunnen verzinnen. En terwijl Dees nog spiegelt en verwisselt, doen u en ik dat in onze lettertekens respectievelijk woorden niet.

Voor de Citotaaltoets geldt iets dergelijks. Zeker, het fasebegrip van de verantwoording is niet houdbaar. Dat laat echter onverlet dat ook zij recht doet aan het feit dat in een volgende fase een of meer kwaliteiten als iets nieuws ontstaan, dat er in de vorige fasen eenvoudigweg niet was; zie bijvoorbeeld de klank-letter-overeenkomst die er wel in haar fase 2 is maar niet in haar fase 1. Er geldt dus eenzelfde redenering voor als we zojuist hebben gehouden voor onze fasen 11-14.

Hierdoor zijn andere aannames in de Citotaaltoets ook niet houdbaar. Met name is het niet zinvol om scores op de Citotaaltoets aan te merken als afwijkingen van gemiddeldes. Dat wil zeggen, de Citotaaltoets geeft een kind dat tussen 25% en 50% boven het gemiddelde scoort, een A; een kind dat tussen 0% en 25% boven het gemiddelde scoort, een B; enzovoort.3 Deze scoringswijze is dus niet geldig en – alle getalsmatigheid in en rond de Citotaaltoets ten spijt – ook niet betrouwbaar.

In het algemeen geldt dat het niet zinvol is om bij een vaardigheid of vermogen waar een ontwikkeling in fasen aan ten grondslag ligt, te spreken van een gemiddelde waar niet-gemiddeldes met een bepaald percentage van af zouden wijken.

D6. Omdat een opgavenbank meer opgaven bevat dan een doorsnee toets, krijgt een leerling in de kalibratie-steekproef (zie D5) slechts een deel van de opgaven in de opgavenbank voorgelegd. Daarom moeten de ontwerpers 'met de nodige omzichtigheid' te werk gaan.

Bespreking. In het licht van het bovenstaande vervalt dit punt om twee redenen geheel. Het heeft geen zin om een procedure die theoretisch niet houdbaar is, op een omzichtige wijze toe te passen. Omdat de inferentieel-statistische methode niet houdbaar is (zie D5), doet een verhoogde omzichtigheid er des te minder toe.

D7. Tot slot loopt de verantwoording vier implicaties langs voor het geval de kalibratie van D5 met goed gevolg is doorgevoerd: 'Als we erin slagen de kalibratie met succes uit te voeren, houden we een zogenaamde gekalibreerde itembank over'.

Bespreking. Dit punt komt voor ons om dezelfde reden als D6 geheel te vervallen. Een niet ter zake doende kalibratie wordt er niet beter op wanneer ze volgens psychometrische maatstaven met succes is uitgevoerd, omdat die maatstaven, zoals we in D5 hebben gezien, niet houdbaar zijn.

E. Het meetmodel van de Citotaaltoets

Ook over het meetmodel van de Citotaaltoets kunnen we kort zijn want het belangrijkste bestanddeel ervan is de item-respons-theorie. Daarover hebben we in D3 en D4 geschreven dat we eraan voorbij kunnen gaan omdat ze een verfijning is van de klassieke testleer waarvan de onhoudbaarheid in dit artikel wordt aangetoond. Daar komt het volgende bij.

Zowel de klassieke testleer als de item-respons-theorie zijn volgens de verantwoording theorieën want ze vallen onder de 'theoretisch inkadering' (p.12) van de Citotaaltoets. Het zijn echter geen theorieën zoals Newtons zwaartekrachtheorie en dergelijke dat zijn. Deze hebben namelijk verklarende kracht; zie §4.1, C1. De klassieke testleer en de item-respons-theorie zijn slechts gehelen van methodologische overwegingen die – als we er welwillend naar kijken – op zijn best verklaringspogingen zijn, namelijk voor de totstandkoming van geldige en betrouwbare kennis. Dat wil zeggen, historisch gezien zijn alle aspecten van de inferentiële statistiek, zoals de klokkromme van afbeelding 25 en de correlatiecoëfficiënt, die we niet bespreken maar in §6.2 van de verantwoording veelvuldig wordt gebruikt, ingevoerd onder verwijzing naar de exacte wetenschappen. De veronderstelling daarbij was steeds dat natuurkundige, sterrekundige kennis en dergelijke ook langs inferentieel-statistische weg tot stand zou zijn gekomen.

Welnu, de inferentiële statistiek als verklaringspoging voor de totstandkoming van kennis in de exacte wetenschappen blijkt niet houdbaar te zijn. In de eerste plaats zijn theorieën als Newtons zwaartekrachttheorie of Mendeleevs theorie van het periodiek systeem er niet langs inferentieel-statistische weg gekomen maar langs de weg van 'verklaringspoging opwerpen voor een onbegrepen verschijnsel en die verklaringspoging aan nieuwe feiten natrekken op houdbaarheid'.15

Het is uiteraard mogelijk dat de grondleggers van de inferentiële statistiek ondanks die onhoudbaarheid een nieuwe manier van kennisverwerving hebben ontdekt. Dan doemt een tweede probleem op, want de inferentiële statistiek wordt gebruikt om nieuwe kennis te verkrijgen, onder meer in de psychologie en in de onderwijskunde. Er zijn dus twee onbekenden in het geding: de nog te vinden nieuwe kennis en de inferentiële statistiek die een nieuwe vorm van kennisverwerving zou zijn.

Ten eerste: na meer dan een eeuw ermee gewerkt te hebben is die nieuwe kennis er is nog steeds niet. In de IQ-psychologie staat de definitie van intelligentie nog steeds op het nivo van 1905 toen Binet en Simon de eerste intelligentietest aan de wereld toonden, namelijk 'intelligentie is wat deze test meet'. En zo staat de definitie van de persoonlijkheid nog steeds op het nivo van 1952 toen Eysenck de eerste persoonlijkheidstest aan de wereld liet zien, namelijk 'de persoonlijkheid is wat deze persoonlijkheidstest meet'.
Maar ten tweede: men zou van een theorie (bijvoorbeeld Newtons zwaartekrachttheorie) kunnen laten zien dat ze er ook langs inferentieel-statistische weg had kunnen komen. Immers, dan zou men bewezen hebben dat – alle kritiek zoals hierboven ten spijt – de inferentiële statistiek, die tot nu toe geen kennis heeft voortgebracht, die wel degelijk ooit kan voortbrengen. Zo'n toets ken ik echter niet en heb ik niet kunnen vinden toen ik ernaar heb gezocht.

4.3 Meetpretentie van de Citotaaltoets

Volgens de verantwoording brengt de Citotaaltoets 'de algemene taalvaardigheid van jonge kinderen in beeld'. Aan die 'algemene taalvaardigheid' zouden twee kanten zitten: gesproken taal en geletterdheid of schriftelijke taalvaardigheid. Ze zouden parallel aan elkaar verlopen: 'Hoe beter de taal ontwikkeld is, hoe gemakkelijker het leren lezen kan verlopen' en 'hoe beter de ontwikkeling tot geletterdheid is verlopen, hoe gemakkelijker het kind de techniek van het leren lezen zal beheersen'.22

Onder 'geletterdheid' zouden de volgende categorieën van de Citotaaltoets vallen: klank en rijm, eerste en laatste woord horen, auditieve synthese en schriftoriëntatie. De verantwoording stelt erover: 'Deze aspecten vallen alle vier onder de ontwikkeling tot geletterdheid'.

Bespreking. Zoals in §4.1, A is uiteengezet is de aanname van het bestaan van één taalvermogen ('algemene taalvaardigheid' genaamd in de verantwoording), waar twee kanten aan zouden zitten (namelijk gesproken taal en geletterdheid), onhoudbaar: geletterdheid is géén taalvermogen maar een ruimtelijk vermogen dat wordt toegepast op het taaldomein. Specifieker gesteld: het ruimtelijke vermogen betreft het duiden van tweedimensionale figuurtjes als 'F', '6', '♪', 'Λ', 'რ', 'ۻ' en '√' en het omzetten van die figuurtjes die letters zijn, in klanken ('F' in /f/; de andere figuurtjes zijn geen letters in het Nederlands) en omgekeerd. Het eerste omzetten valt onder lezen en het tweede onder schrijven.

De uitspraak 'Hoe beter de taal ontwikkeld is, hoe gemakkelijker het leren lezen kan verlopen' is dan ook niet houdbaar. Om een tekst in een bepaalde taal te kunnen begrijpen is een zekere vaardigheid in die taal een vereiste, maar om 'ქართული ენა' technisch vlekkeloos te leren lezen acht ik mezelf wel in staat, indien ik maar weet voor welke klanken de afzonderlijke lettertekens in het betreffende alfabet (hier van het Georgisch) staan en welke de afwijkingen zijn (zoals in het Nederlands dat de uitspraak van 'badend' /baadunt/ is).

De uitspraak 'hoe beter de ontwikkeling tot geletterdheid is verlopen, hoe gemakkelijker het kind de techniek van het leren lezen zal beheersen' daarentegen bevat een houdbare gedachte, die ik zelf echter nooit zo zou zeggen. Immers, de 'ontwikkeling tot geletterdheid' bestaat volgens de verantwoording uit drie fasen waar het technische lezen een onderdeel van is, namelijk in haar fase 2 (de klank-letter-overeenkomst) en haar fase 3 (het automatiseren); zie §4.1, B. Dus, als de 'ontwikkeling tot geletterdheid is verlopen' zit het kind per definitie in deze fase 3, terwijl er nu staat dat er nog wat zal gebeuren: 'het kind zal de techniek van het leren lezen beheersen'.

Met een onderscheid tussen '(gesproken) taal' en 'geletterdheid' zijn we het dus graag eens, zij het om een andere reden, namelijk 'taalvermogen versus ruimtelijk vermogen toegepast op de klanken van een taal'. Het onderscheid van de verantwoording stelt ons echter voor een probleem. Want hoe zit het nu: zegt de Citotaaltoets, die 'algemene taalvaardigheid', waaronder 'geletterdheid', zegt te meten, iets over leesrijpheid of niet? Als gesproken taal en geletterdheid zich zo parallel zouden ontwikkelen als de verantwoording stelt of suggereert, is het niet uit te sluiten dat de Citotaaltoets leesrijpheid even goed meet als de som van de vier aspecten van geletterdheid. Bovendien stelt de verantwoording dat in de Citotaaltoets 'de vaardigheid taal kan worden opgevat als een unidimensionaal continuüm' en dat een getal de mate van taalvaardigheid uitdrukt, 'waarbij een groter getal wijst op een grotere taalvaardigheid' (zie ook §4.2, D1).

Volgens mij is de verantwoording hier óf onduidelijk óf in tegenspraak met zichzelf. We gaan dit punt niet proberen op te lossen en zullen twee wegen bewandelen. Nadat we in §4.4 de inhoud van de Citotaaltoets hebben geschetst en besproken, bekijken we in §5.2 de resultaten op de gehele toets en in §5.3 die op de vier geletterdheidsaspecten.

4.4 De opgaven van de Citotaaltoets

De Citotaaltoets is tot stand gekomen op grond van de gedachtes die in §4.1 en §4.2 zijn geschetst en besproken: 'Op basis van inhoudelijke criteria (spreiding over inhoudelijk onderscheiden categorieën en het belang van het betreffende onderdeel in het onderwijs) en psychometrische criteria (met name moeilijkheidsgraad en discriminatieparameter) zijn opgaven geselecteerd'.23

De Citotaaltoets bestaat uit 60 meerkeuzevragen, 11 driekeuzevragen (opgaven 1-4, 12-14, 53-54 en 59-60) en 49 vierkeuzevragen. Er zijn zes categorieën, met tussen haakjes de opgavenummers en het aantal opgaven:

passieve woordenschat (1-6 en 22-30; totaal: 15);
kritisch luisteren (7-21; totaal: 15);
klank en rijm (31-38; totaal: 8);
eerste en laatste woord horen (39-44; totaal: 6);
auditieve synthese (45-52; totaal: 8);
schriftoriëntatie (53-60; totaal: 8).

We lopen ze eerst langs en bespreken ze in §4.4.7.

4.4.1 Passieve woordenschat
In 'passieve woordenschat' 'moeten de leerlingen een "begrip" aan een persoon, voorwerp, handeling of situatie koppelen'.

Voorbeeld 1. Opdracht 4. Op drie tekeningen staan twee bruine runderen, grazen zes runderen respectievelijk staat één rund. De leerkracht zegt twee keer: 'Waar zie je een kudde? Zet een streep onder de kudde'.
Voorbeeld 2. Opdracht 26. Op vier tekeningen staat een olifant met slagtanden, een hert met gewei, een neushoorn met gehoornde neus respectievelijk een rund met twee hoorns. De leerkracht zegt twee keer: 'Waar zie je een gewei? Zet een streep onder het gewei'.

4.4.2 Kritisch luisteren
'Kritisch luisteren' heeft twee subcategorieën.
In de eerste subcategorie, 'kort verhaal', 'moeten de leerlingen een kort verhaal aan een situatie koppelen'.

Voorbeeld. Opdracht 9. Op vier tekeningen staan gras met daarop een jongen die een bal naar een man in een doel schopt, gras met daarop een man die een bal naar een jongen schopt, verhard terrein met daarop een man die een bal naar een jongen in een doel schopt, respectievelijk gras met daarop een man die een bal naar een jongen in een doel schopt. De leerkracht zegt twee keer: 'Karim en papa zijn buiten. Ze voetballen op het grasveld. Karim staat in het doel en papa schopt de bal naar hem. Zet een streep onder dat plaatje'.

In de tweede subcategorie, 'kort verhaal met vraag', 'moeten de leerlingen een vraag over een kort verhaal beantwoorden door het antwoord op de vraag aan een situatie te koppelen'.

Voorbeeld. Opdracht 15. Op vier tekeningen staan een rolstoel, een personenauto, een hond met geleidetuig respectievelijk een rollator. De leerkracht zegt twee keer: 'Daar komt opa de straat in lopen. Opa is heel oud. Hij kan niet meer zo goed lopen. Wat heeft opa bij zich? Zet een streep onder dat plaatje'.

4.4.3 Klank en rijm
'Klank en rijm' heeft eveneens twee subcategorieën.
In de eerste subcategorie, 'herkennen beginklank woord', 'moeten de leerlingen uit een reeks door de leerkracht uitgesproken woorden het woord met de gevraagde (fonetisch uitgesproken) beginklank halen'.

Voorbeeld. Opdracht 33. Op vier tekeningen staan een rat, een ster, een tor respectievelijk een doos. De leerkracht zegt twee keer: 'Hier zie je rat – ster – tor – doos'. Welk woord begint met t? rat – ster – tor – doos Zet een streep onder dat plaatje'.

In de tweede subcategorie, 'herkennen eindrijm', 'moeten de leerlingen uit een reeks door de leerkracht uitgesproken woorden het correcte rijmwoord halen'.

Voorbeeld. Opdracht 37. Op vier tekeningen staan een kan, een mond, een hand respectievelijk een vlam. De leerkracht zegt twee keer: 'land Welk woord rijmt op land? kan – mond – hand – vlam Zet een streep onder het woord dat rijmt op land'.

4.4.4 Eerste en laatste woord horen
In 'eerste en laatste woord horen' 'onthouden de leerlingen welk woord uit een reeks trefwoorden als eerste óf als laatste werd uitgesproken door de leerkracht'.

Voorbeeld. Opdracht 40. Op vier tekeningen staan een oor, een mond, een oog respectievelijk een neus. De leerkracht zegt twee keer: 'Welk woord zeg ik het eerst? oog – oor – neus – mond Zet een streep onder dat plaatje'.

4.4.5 Auditieve synthese
In 'auditieve synthese' moeten de leerlingen losse klanken (fonemen) in gedachten samenvoegen tot een ge-sproken woord'.

Voorbeeld. Opdracht 46. Op vier tekeningen staan een das, een muts, een hoed respectievelijk een want. De leerkracht zegt twee keer: 'Hier zie je das – muts – hoed – want Zet een streep onder m – u – t – s'.

4.4.6 Schriftoriëntatie
In 'schriftoriëntatie' 'moeten de leerlingen zich richten op visuele aspecten van de taal en blijk geven van algemene kennis over boeken'.

Voorbeeld 1. Opdracht 53. In drie kaders staan het woord 'boek', het cijfer '7' respectievelijk de letter 'h'. De leerkracht zegt twee keer: 'Hier zie je een cijfer, een letter en een woord. Zet een streep onder de letter'.
Voorbeeld 2. Opdracht 54. In een kader staat het woord 'pet'. De leerkracht zegt twee keer: 'Hier zie je een woord. Zet een streep onder de eerste letter'.
Voorbeeld 3. Opdracht 57. Op vier tekeningen staan de voorkant van een boek met daarop een jongen die een taartpunt eet, de voorkant van een boek met daarop een jongen die een taart op een tafel ziet staan, de voorkant van een boek met daarop een jongen die op zijn knieën vóór het venster van een oven met daarin een ronde taartvorm zit, respectievelijk de voorkant van een boek met daarop een jongen die een punt uit een taart snijdt. De leerkracht zegt twee keer: 'Thomas leest een boek over een jongen die een taart bakt. Zet een streep onder dat boek'.

4.4.7 Algemene overwegingen
In beginsel is er met de opdrachten van de Citotaaltoets niets mis. Door de meerkeuzevorm zit er echter een aantal oneigenlijke en dus ongewenste aspecten aan.

In de eerste plaats is er het feit dat op elk van die 60 opdrachten in beginsel oneindig veel reacties mogelijk zijn: juiste maar ook onjuiste. Dat laatste wordt in een meerkeuzevraag feitelijk erkend. In opdracht 4 bijvoorbeeld (zie §4.4.1) is de tweede tekening (zes runderen) juist en de eerste (twee runderen) en de derde tekening (één rund) niet: zes runderen vormen een kudde en één rund en twee runderen niet. Andere mogelijke onjuiste tekeningen zijn die van een zwerm vogels, van een school vissen, van één potlood, van vijf televisietoestellen, enzovoort. Welnu, aan die feitelijkheid – het bestaan van in beginsel oneindig veel reacties – doet een meerkeuzetoets en dus ook de Citotaaltoets geen recht. In een driekeuzevraag wordt die oneindigheid teruggebracht tot drie en in een vierkeuzevraag tot vier: een juiste en twee respectievelijk drie onjuiste reacties.

In de tweede plaats wegen onjuiste reacties even zwaar. In onze bespreking onderscheiden we twee soorten onjuiste reacties.

Als een kind ergens niet aan toe is, is het niet zinvol een onjuiste reactie als onjuist te bestempelen. Dat is pas zinvol bij een kind dat ergens aan toe is. Alvorens men van een kind zijn mate van vaardigheid tracht vast te stellen, dient gebleken te zijn dat een kind aan de betreffende soort opdrachten toe is. In de ontwikkelingspsychologie onderscheiden we binnen de reacties dan ook 'juist', 'onjuist' en 'juist in wording'. Bijvoorbeeld, als Cas (van §3.2) 'krant' als /krant/ leest, is dat juist en als hij 'markt' als /mast/ zou lezen, zou dat onjuist zijn want hij is leesrijp en maakt dan dus een fout. Als Floris (van §3.6) daarentegen 'rem' als /r, e, m/ leest zonder er /rem/ van te maken, is dat 'juist in wording'. Het is evident niet juist, maar ook niet onjuist: een fase-13-lezer leest nu eenmaal losletterig en is niet in staat van /r, e, m/ /rem/ te vormen. Een meerkeuzetoets staat dus ten onrechte op het vlak van de tweedeling 'juist-onjuist' en doet geen recht aan de feitelijke driedeling 'juist-onjuist-juist in wording'.
Ook bij een kind dat ergens aan toe is, is het niet houdbaar om alle juiste reacties onderling even zwaar te laten wegen en om datzelfde te doen bij alle onjuiste reacties. Op leesgebied is een goed voorbeeld dat twee kinderen alle 26 letters in het klankzuivere deel van Zo ontdek ik het lezen! hebben gehad en allebei op een overhoring een letter niet blijken te kennen: het ene kind weet niet meer hoe 't' klinkt en het andere niet meer hoe 'y' klinkt. Omdat beiden leesrijp zijn, maken beiden dus een fout. Echter, aangezien de 't' als derde letterteken aan de orde is geweest en 'y' als vijfentwintigste letter, terwijl 't' veel vaker in het Nederlands voorkomt dan 'y', dient de eerste fout zwaarder te wegen dan de tweede. Een ander voorbeeld is dat het ernstiger is dat kind in een Nederland niet weet hoe de hoofdstad van België heet, dan dat het niet weet hoe die van Georgië heet. Toch levert in een meerkeuzetoets een juiste reactie steeds score 1 op en een onjuiste reactie score 0.24

In de derde plaats haalt de meerkeuzevorm met een toets die geacht wordt iemands mate van beheersen te bepalen, het onderwijsrendement omlaag. Immers, indien de juiste reactie al bij de vraag wordt gegeven, hoeft het kind die slechts te herkennen. In opdracht 4 (zie §4.4.1) bijvoorbeeld is het herkennen van het woord 'kudde' wat anders dan het actief beheersen van het woord 'kudde', bijvoorbeeld in een vraag als 'Veel vissen bij elkaar vormen een school; veel vogels bij elkaar vormen een zwerm. Wat vormen veel koeien bij elkaar?'. Kortom, de meerkeuzevorm wisselt het actieve beheersen van de juiste reactie ten onrechte in voor het relatief passieve herkennen ervan.25

Dat mikken op herkennen in plaats van op beheersen komt ook tot uiting in twee van de vier geletterdheids-categorieën van de Citotaaltoets. In 'klank en rijm' en 'auditieve synthese' zegt de leerkracht het te onderstrepen woord vóór. In opdracht 37 bijvoorbeeld (§4.4.3) zit het rijmwoord van 'land' al in het viertal dat de leerkracht twee keer zegt, 'kan, mond, hand, vlam'. Dat is iets anders en ook iets gemakkelijkers dan de opdracht 'Noem een woord dat op /land/ rijmt'. En in opdracht 46 bijvoorbeeld (§4.4.5) is het woord /muts/ als synthese van /m, u, t, s/ al voorgezegd. Ook dat is iets anders en iets gemakkelijkers dan uit de voorgezegde klanken /m/, /u/, /t/ en /s/ zelf het woord /muts/ samenstellen.

In de vierde plaats zorgt de meerkeuzevorm voor oneigenlijke en dus ongewenste kansaspecten (zie §4.2, D4) en kan het kind zijn reactie niet toelichten. Een voorbeeld van dat laatste, dat ik ontleen aan Riet de Jong van de Werk- en Steungroep Kleuteronderwijs, is dat een meisje in opdracht 15 (§4.4.2) een streep onder de rolstoel zet. Haar oma loopt namelijk enkele keren per week achter haar rolstoel naar haar dochter, schoonzoon en kleindochter om in haar rolstoel teruggereden te worden. Haar reactie is dus juist. Een meerkeuzetoets kan dat echter per definitie niet tot uitdrukking brengen.

Als we dan naar de vier geletterdheidscategorieën kijken, komt hier voor elk nog een overweging bij.

In de vijfde plaats onderzoekt 'klank en rijm' (§4.4.3) van klank- en rijmvaardigheid slechts twee vormen. Van de acht opdrachten gaan er vier over de beginklank en vier over eindrijm. Daarmee blijven andere vormen van klankanalyse op het nivo van fase 13, die voorafgaat aan het technisch leren lezen in fase 14, buiten beeld: hakken van zinnen in woorden, hakken van woorden in klankvoeten, stafrijm, het verschil tussen korte en lange klinkers, enzovoort.

In de zesde plaats is het doel van 'eerste en laatste woord horen' (§4.4.4): 'onthouden welk woord uit een reek.

Samenvatting

De theoretische basis van de Citotaaltoets vertoont aanzienlijke tekortkomingen bij het meten van geletterdheid, zoals het verkeerd koppelen van geletterdheid aan taalontwikkeling en het negeren van essentiële psychologische aspecten. De tests missen een verklarende theoretische basis en zijn problematisch vanwege een eenzijdige benadering in het testontwerp en inconsistenties in het kalibratieproces. Hierdoor wordt de betrouwbaarheid en validiteit van de resultaten betwist. Ook de opgaven van de Citotaaltoets, die verschillende vaardigheden meten zoals woordenschat en luisteren, worden bekritiseerd vanwege beperkingen in de meerkeuzevorm die niet alle aspecten volledig kunnen meten. Het is dus cruciaal om deze tekortkomingen in overweging te nemen bij het interpreteren van de resultaten.

Heb je vragen over dit thema? Stel ze in de onderwijs community binnen de Wij-leren.nl Academie!