Cito spellingtoets ter discussie
Anna Bosman
Hoogleraar bij Radboud Universiteit Nijmegen
Geraadpleegd op 12-12-2024,
van https://wij-leren.nl/cito-spelling-toets.php
Gebruik van meerkeuzevragen is bij spellingtoetsen niet verantwoord
Dit artikel is geschreven samen met J.L.M. Schraven en T. van Eekhout
Samenvatting
Het doel van deze studie was om na te gaan of de keuze die het Cito gemaakt heeft om ter toetsing van de spellingvaardigheid een onderdeel van het dictee te vervangen door een meerkeuzetoets verantwoord is. In dit onderzoek is de toets Spelling groep 4 op twee verschillende manieren aan leerlingen voorgelegd. Eerst werd de meerkeuzetoets afgenomen overeenkomstig de instructies in de handleiding. Daarna schreven de leerlingen alle spellingwoorden die centraal stonden in de meerkeuzetoets op basis van een mondeling dictee. Statistische analyses lieten zien dat de psychometrische eigenschappen van de meerkeuzetoets onvoldoende zijn. Ook bleken de totaalscores op de meerkeuzetoets niet samen te hangen met de totaalscores op het dictee.
Bovendien maakten de meeste leerlingen het dictee (een productietaak) beter dan de meerkeuzetoets (een herkenningstaak) en waren er grote individuele verschillen tussen de leerlingen op de twee taken. Ten slotte was er een substantiële discrepantie bij ruim een kwart van de woorden. Dat wil zeggen, in 16.0% van de gevallen was de spelling goed op het dictee en fout op de meerkeuzetoets en in 9.8% fout op het dictee en goed op de meerkeuzetoets. Gedetailleerde analyses op itemniveau doen het vermoeden rijzen dat leerlingen op andere gronden keuzes maakten in de meerkeuzetoets dan was bedoeld, namelijk het herkennen van de spellingfout. Kennis van woorden en leesvaardigheid spelen waarschijnlijk een belangrijke rol in deze test die toch vooral spellingkennis moet meten. De auteurs pleiten dan ook voor het herinvoeren van een woorddictee (met een eventuele aanvulling van een zinnendictee) om tegemoet te komen aan het eigenlijke doel van het spellingonderwijs, namelijk uit het hoofd kunnen spellen van woorden.
1 Inleiding
Sinds 2006 heeft het Cito nieuwe spellingtoetsen op de markt gebracht als vervanging van de oude SVS-toetspakketten. Deze nieuwe spellingtoetsen bestaan uit twee delen, namelijk een startmodule en twee typen vervolgmodules. Alle leerlingen beginnen met de startmodule. Deze wordt gevormd wordt door een dictee van 25 woorden dat klassikaal wordt afgenomen. Op basis van de prestaties van de leerlingen op dit dictee worden de leerlingen onderverdeeld in een groep minder goede spellers en een groep betere spellers. De leerlingen met een lage score krijgen vervolgens de module ‘Spelling Vervolg 1’, dat in het geval van de groepen 3 tot 5 opnieuw een dictee van 25 woorden betreft. De leerlingen met een hoge score op de startmodule maken de module ‘Spelling Vervolg 2’. Dit is een meerkeuzetoets. Deze bestaat uit 25 opgaven waarbij uit telkens vier zinnen het foutgespelde woord omcirkeld dient te worden. In Figuur 1 staat de voorbeeldopgave uit de spellingtest voor groep 4. Overigens zullen de vervolgmodules voor zowel de zwakke als de goede spellers uit de groepen 6 tot 8 bestaan uit meerkeuzetoetsen. Het feit dat de betere spellers in de groepen 3-5 meerkeuzeopgaven maken in plaats van een dictee en dat vanaf groep 6 de toetsvorm voor alle leerlingen meerkeuze is, is een breuk met de oude spellingtoetsen.
In de handleiding van de toets Spelling Groep 4 worden redenen gegeven voor het veranderen van de inhoud van de spellingtoets. Dit zijn de wettelijk vastgestelde spellingveranderingen en het feit dat er nieuwe spellingmethoden op de markt zijn gekomen. De keuze van het Cito om de vorm van de spellingtoets te veranderen, wordt in diezelfde handleiding niet verantwoord. Uit het feit dat het Cito geen verantwoording geeft voor de vervanging van het dictee door een meerkeuzetoets leiden wij af dat de ontwikkelaars veronderstellen dat deze twee toetsvormen inwisselbaar zijn. Het doel van deze studie is om na te gaan of deze veronderstelling terecht is.
A Ben je in de zomer op vakantie geweest? B De caviea van de buren heet Sammie. C Mijn moeder heeft een taart gebakken D Weet jij waarom hij zo raar doet? |
Figuur 1. Voorbeeldopgave Spelling M4 Vervolg 2
1.1 Meerkeuze als toetsvorm voor spellingvaardigheid
Sinds de invoering van de nieuwe spellingtoets uiten leerkrachten en IB-ers hun bezorgdheid over de vervanging van het dictee door een meerkeuzetoets. Zij vragen zich af a) of het aanstrepen van een woord hetzelfde is als opschrijven ervan, b) wat de gevolgen kunnen zijn van de presentatie van foutgespelde woorden, en c) welke diagnostische waarde een meerkeuzetoets heeft.
Opschrijven of aanstrepen
In de handleiding van de toets Spelling groep 4 staat de volgende definitie: “Bij spellen gaat het erom woorden om te zetten in schriftbeelden” (p. 9, de Wijs, Krom & van Berkel, 2006). Wij leiden hieruit af dat spellen een vaardigheid is waarbij men uit het hoofd de orthografische vorm van een woord opschrijft dan wel intypt. De makers van de spellingtoets lijken er dus vanuit te gaan dat spellen het opschrijven van woorden is en niet het aanstrepen. Het taakverschil tussen het aanstrepen van een woord en het opschrijven ervan, wordt ook wel aangeduid met het onderscheid tussen een herkenningstaak en een productietaak. Een meerkeuzetoets is een goed voorbeeld van een herkenningstaak en een dictee is een voorbeeld van een productietaak. Dat deze twee taken of toetsvormen meestal niet inwisselbaar zijn, is reeds uit onderzoek gebleken (e.g., Bosman & de Groot, 1992, 1996). In veel gevallen, maar niet altijd, is een herkenningstaak makkelijker dan een productietaak.
Presenteren van foutgespelde woorden
Uit de dagelijkse schoolpraktijk kennen we de negatieve consequenties van het aanbieden van foutgespelde woorden; dit wordt ondersteund door wetenschappelijk onderzoek. Het blijkt dat het regelmatig aanbieden van foutgespelde woorden de spellingvaardigheid van spellers negatief kan beïnvloeden. Zowel goede als zwakke spellers blijken niet gebaat te zijn bij blootstelling aan foute spellingen (Brown, 1988; Dixon & Kaminska,1997; Jacoby & Hollingshead, 1990).
Diagnostische mogelijkheden
Voor leerkrachten is de belangrijkste waarde van een toets of deze informatief is met betrekking tot het soort fouten dat gemaakt wordt. Pas als een toets inzicht geeft in de spellingproblemen van de leerling kan deze adequaat geholpen worden. Vanuit diagnostisch oogpunt bezien is de oorsprong van de fouten die in een dictee worden gemaakt meestal wel duidelijk. Immers, een leerling die GIJT spelt in plaats van GEIT heeft in dit geval een probleem met de foneem-grafeem koppeling [ei] –IJ of EI. In het geval dat er ZOOMER geschreven is in plaats van ZOMER, is het gerechtvaardigd om te veronderstellen dat deze leerling de regel voor de openlettergreep niet beheerst. Bij een meerkeuzetoets is het veel lastiger vast te stellen of en welk spellingprobleem een leerling heeft in het geval deze een fout maakt. Ook wanneer de leerling de juiste keuze maakt, blijft het de vraag in hoeverre hij of zij de spelling van het woord ook daadwerkelijk uit het hoofd kan produceren. Stel dat een leerling in het voorbeeld van Figuur 1 onterecht aankruist dat ZOMER het foutgespelde woord is. De leerling heeft dan weliswaar een mentale ‘spelfout’ gemaakt, maar de vraag is vervolgens: welke dan? Het kan zijn dat deze leerling dacht dat de juiste spelling ZOOMER is. Het kan echter ook zijn dat deze leerling denkt dat het SOMER moet zijn of zelfs ZOMUR, etc. Omdat we geen idee hebben op grond waarvan deze leerling dacht dat het goed gespelde woord ZOMER fout was, krijgen we dus geen inzicht in het spellingprobleem van deze leerling.
1.2 Doel van dit onderzoek
In dit onderzoek zal dus worden nagegaan of het gerechtvaardigd is om voor het bepalen van de spellingvaardigheid het dictee te vervangen door een meerkeuzetoets. Hiervoor zal de toets Spelling medio groep 4 gebruikt worden. Module Spelling Vervolg 2 zal op twee verschillende manieren worden afgenomen. Eerst wordt de toets aan de leerlingen aangeboden zoals staat voorgeschreven in de handleiding van de toets, namelijk als meerkeuzetoets. Vervolgens worden alle toetswoorden in een dicteevorm aangeboden.
De (on)gelijkwaardigheid van de meerkeuzetoets en het dictee zal op meerdere niveaus worden bepaald. We beginnen met de vaststelling van de betrouwbaarheid en validiteit van de dictees en de meerkeuzetoets. Vervolgens gaan we op groepsniveau nader in op de vergelijking tussen de meerkeuzetoets en het dictee. Hierbij zal worden vastgesteld hoeveel leerlingen consistent gedrag laten zien op beide toetsvormen. Ten slotte wordt er een vergelijking gemaakt tussen de meerkeuzetoets en het dictee op itemniveau. Hiermee wordt inzicht verkregen in de mate waarin elk item zich consistent gedraagt op beide toetsvormen.
2 Methode
2.1 Proefpersonen
In dit onderzoek participeerden 18 leerlingen (6 meisjes en 12 jongens met een gemiddelde leeftijd van 94 maanden) uit groep 4 van een reguliere basisschool. Geen van de leerlingen had gedoubleerd in Groep 3 of 4. Een leerling (in oktober geboren) heeft Groep 2 twee keer gedaan. De school betrekt haar leerlingen voor het grootste deel uit lagere sociaaleconomische milieus. Op basis van de nieuwe gewichtenregeling basisonderwijs (Ministerie van OCW, 2006) bleek één leerling een gewicht van 1,2 te hebben (ouders die niet meer dan basisonderwijs hebben gehad) en één leerling had een gewicht van 0,3 (hiervan hadden de ouders niet meer dan een lbo/vbo-opleiding genoten).
2.2 Materiaal en procedure
Het materiaal van dit onderzoek werd, zoals gezegd, gevormd door de spellingwoorden van de toets Spelling M4 (de Wijs e.a., 2006). In januari 2008 heeft de derde auteur van dit artikel (de remedial teacher van een reguliere basisschool) de nieuwe spellingtoets op twee verschillende manieren afgenomen bij de leerlingen van groep 4. Bij de eerste afname werd de in de handleiding voorgeschreven procedure gevolgd. Dit hield in dat alle leerlingen de startmodule aangeboden kregen. Aan de hand van een dictee schreven de leerlingen de ‘Startwoorden’ op. De remedial teacher bepaalde vervolgens van elke leerling de score en nam daarna Vervolgmodule 2 af. Omdat alle leerlingen een score hadden die hen tot de betere spellers rekenden, konden alle leerlingen meedoen aan dezelfde vervolgtest, dat wil zeggen de meerkeuzetoets met 25 opgaven (zie Figuur 1 uit de inleiding). De leerlingen moesten uit vier vetgedrukte woorden die in vier verschillende zinnen staan (A, B, C, en D-zinnen), het woord dat fout gespeld is, kiezen (zie Tabel 5). In de tweede fase van het onderzoek werd er op vier verschillende dagen een dictee afgenomen van de vetgedrukte woorden. Op de eerste dag werden de woorden uit de A-zinnen gedicteerd, op de tweede die van de B-zinnen, de derde dag werden de C-zinnen aangeboden en op de laatste dag de D-zinnen. Van alle leerlingen werd van elk woord bepaald of dit correct dan wel incorrect gespeld was. De score van elke leerling vormde de input voor de onderstaande analyses.
3 Resultaten
De beschrijving van de resultaten valt uiteen in drie onderdelen. Eerst worden de psychometrische eigenschappen (i.c. de betrouwbaarheid en de validiteit) van de onderscheiden toetsen bepaald. Daarna zal worden nagegaan of het herkennen van de correcte spelling (meerkeuze) vergelijkbaar is met het produceren ervan (dictee) voor de groep als geheel. Vervolgens wordt bekeken wat de uitslagen/consequenties zijn voor de individuele leerlingen van deze onderzoeksgroep en ten slotte zal er een vergelijking op itemniveau plaatsvinden.
Bij de presentatie van de resultaten worden de volgende aanduidingen gehanteerd.
- Startwoorden zijn de 25 dicteewoorden uit de startmodule.
- Meerkeuzetoets verwijst naar de meerkeuzeopgaven van vervolgmodule 2 (zie Figuur 1 voor een voorbeeld).
- Dicteewoorden zijn de foutgespelde woorden uit de meerkeuzetoets die in dicteevorm zijn aangeboden.
- A-woorden, B-woorden, C-woorden en D-woorden zijn alle dikgedrukte woorden uit respectievelijk de A-zinnen, B-zinnen, C-zinnen en D-zinnen die in dicteevorm zijn aangeboden.
- A-D woorden zijn alle dikgedrukte woorden uit alle vier de zinnen van de meerkeuzetoets die in dicteevorm zijn aangeboden.
3.1 Betrouwbaarheid en validiteit
Op basis van het criterium dat een toets minimaal een alfawaarde van .80 moet hebben wil deze betrouwbaar genoemd kunnen worden, blijkt dat feitelijk geen van de toetsen aan die betrouwbaarheideis voldoet (zie 2e kolom van Tabel 1). Ten aanzien van de criteriumvaliditeit zien we dat hoewel vier van de acht correlaties significant zijn, de hoogten van de correlaties allemaal onvoldoende zijn (lager dan .80) om de meerkeuzetoets valide te noemen (zie 3e kolom van Tabel 1). De belangrijkste correlatie, die tussen de meerkeuzetoets en de dicteewoorden, was zelfs niet statistisch significant. De conclusie is dus dat de meerkeuzetoets niet hetzelfde meet als het dictee en dat ze dus niet inwisselbaar zijn.
3.2 Meerkeuze versus dictee op groepsniveau
In de laatste kolom van Tabel 1 staan de gemiddelde scores op alle toetsvormen. Om te bepalen of de leerlingen de meerkeuzetoets beter dan wel slechter maakten dan de dictees zijn de gemiddelde scores met elkaar vergeleken. Een eerste interessante bevinding is dat de gemiddelde score op de meerkeuzetoets lager is dan 20, terwijl die van alle verschillende dictees hoger is dan 20. De statistische toetsen uit Tabel 2 laten zien dat het verschil tussen de meerkeuzetoets en de dicteewoorden significant is. Dit betekent dat leerlingen de dicteewoorden significant beter maakten dan de meerkeuzetoets. Ook de dictees over de C-woorden, de A-D woorden en de Startwoorden waren significant beter gemaakt dan de meerkeuzetoets. Het dictee over de Startwoorden en de Dicteewoorden werd even goed gemaakt.
3.3 Meerkeuze versus dictee op individueel niveau
In Tabel 3 staan de individuele scores op de meerkeuzetoets en de dicteewoorden. Voor vier leerlingen (22.2%) was de meerkeuzetoets makkelijker dan de dicteewoorden, voor drie leerlingen (16.7%) was er geen verschil, terwijl voor 11 leerlingen (61.1%; zie gearceerde cellen) de meerkeuzetoets moeilijker was dan het uit het hoofd opschrijven van de dicteewoorden. Met name voor de leerlingen 2, 12 en 14 bleek het bijzonder nadelig te zijn indien hun spellingvaardigheid middels een meerkeuzetoets bepaald werd.
3.4 Meerkeuze versus dictee op itemniveau
In Tabel 4 staan een aantal belangrijke statistische gegevens per item. In de eerste drie kolommen staat per item het percentage leerlingen dat dit item goed had aangekruist op de meerkeuzetoets, het percentage leerlingen dat dit item goed gespeld had op het dictee en het verschil tussen beiden. De t-testen laten vervolgens van ieder item zien of er een significant verschil was in de prestaties op de meerkeuzetoets en het dictee. Dit was het geval voor 7 van de 25 items. Het betrof zwak, scherm, sloep, aanrecht, lusje, goed en pootje. Uit de analyse over alle items blijkt dat het gemiddelde verschil tussen de prestaties op de meerkeuzetoets en het dictee in het voordeel is van het dictee. Het op het oog slechts geringe gemiddelde significante verschil van 6% (zie de laatste regel van de Tabel 4) krijgt een geheel andere betekenis wanneer het tweede deel van Tabel 4 in beschouwing wordt genomen.
Het betreft hier de kolommen ‘overeenstemming’ en ‘discrepantie’. Onder de kolom ‘overeenstemming’ staan de kolommen Goed/Goed en Fout/Fout. De kolom Goed/Goed bevat per item het aantal leerlingen dat dit item goed had op de meerkeuzetoets en goed op het dictee. De kolom Fout/Fout bevat per item het aantal leerlingen dat dit item fout had op de meerkeuzetoets en fout op het dictee. Onder de kolom ‘discrepantie’ staan de kolommen Goed/Fout en Fout/Goed. De kolom Goed/Fout bevat per item het aantal leerlingen dat dit item goed had op de meerkeuzetoets en fout op het dictee, terwijl de kolom Fout/Goed het aantal leerlingen bevat dat dit item fout had op de meerkeuzetoets en goed op het dictee.
Als de meerkeuzetoets hetzelfde meet als het dictee dan zouden er geen leerlingen mogen voorkomen in de twee kolommen die onder discrepantie staan. Dit blijkt voor slechts één woord te gelden, namelijk STANK. Op de woorden HOND en KLANK is er bij een leerling een discrepantie. Bij 11 van de 25 woorden (44%) is er bij minimaal 25% van de leerlingen geen overeenstemming tussen dictee en meerkeuzetoets en bij 3 van de 25 woorden is er zelfs bij meer dan 50% van de leerlingen geen overeenstemming (BOOTTOCHT, ZWAK en VLOT).
Dit kan twee dingen betekenen. In het ene geval concludeert de leerkracht ten onrechte op basis van de meerkeuzetoets dat een leerling de spelling van een woord niet beheerst, terwijl op het dictee blijkt dat ze dat wel kunnen (e.g., ZWAK). In het andere geval zou onterecht geconcludeerd worden op basis van de meerkeuzetoets dat een leerling de spelling van het woord beheerst, terwijl het dictee uitwijst dat dit niet het geval is (e.g., AANRECHT). Uit de gemiddelden blijkt dat 16% van de leerlingen niet het fout gespelde woord op de meerkeuzetoets kiest, terwijl zij dit woord op het dictee wel correct spellen, en 9,8% van de leerlingen kiest wel het foutgespelde woord op de meerkeuzetoets, terwijl ze dit fout spellen op het dictee.
Dus, in een kwart van de gevallen (9.8% + 16.0% = 25.8%) was er een discrepantie tussen de prestaties op de meerkeuzetoets en het dictee. Statistische toetsing middels Phi, een maat voor samenhang vergelijkbaar met Pearson correlatie, laat zien dat er slechts voor één item (i.c. scherm) een significante samenhang is. Dit bevestigt het inconsistente patroon dat waargenomen kan worden in deze gegevens. De kans dat een item goed is gemaakt op de meerkeuzetoets heeft nauwelijks een relatie met de kans dat dit item op het dictee ook goed gespeld wordt en andersom. Dit betekent voor de diagnostiek dat een leerkracht op basis van de meerkeuzetoets per woord bij gemiddeld ruim een kwart van de leerlingen een onjuist beeld krijgt van de spellingvaardigheid van een leerling.
In Tabel 5 staat per meerkeuzeopgave van alle vier de mogelijke opties het percentage leerlingen dat dit item als het foutgespelde woord koos. Ook staat per item aangegeven het percentage leerlingen dat dit woord op het dictee correct spelde. Dit overzicht brengt een aantal merkwaardigheden aan het licht.
De 1e meerkeuzeopgave is het duidelijkste voorbeeld dat een meerkeuzetoets leerlingen in verwarring kan brengen. Hier moesten de leerlingen kiezen tussen de vier alternatieven VLAG, WRAK, GRAP en SWAK. Minder dan een kwart van de leerlingen gaf correct aan dat SWAK het foutgespelde woord was; de meeste leerlingen besloten dat WRAK fout gespeld was. In het dictee bleek dat de overgrote meerderheid van de leerlingen wel degelijk de spelling van ZWAK kende, terwijl slechts een heel gering percentage leerlingen het woord WRAK correct spelde. Als alleen de meerkeuzetoets was afgenomen, dan was ten onrechte geconcludeerd dat de leerlingen de spelling van ZWAK niet beheersen. Onze analyse leidt echter tot een alternatieve conclusie: de leerlingen kenden zeer waarschijnlijk het woord WRAK niet.
De 9e meerkeuzeopgave is een voorbeeld van de rol die kennis van de woordbetekenis of het ontbreken daarvan kan spelen bij het maken van de meerkeuzetoets voor spelling. Hier moesten de leerlingen kiezen tussen de vier alternatieven GOUDGEEL , LICHT, LUSJU en GEULEN. Iets meer dan de helft koos correct voor LUSJU, terwijl ruim een kwart GEULEN koos als de foute spelling. Op de dictees bleek echter dat zowel LUSJE als GEULEN door vrijwel iedereen correct gespeld werd. Het vermoeden bestaat dat niet alle leerlingen het woord GEULEN kenden en dat dit in de meerkeuzetoets tot verwarring heeft geleid. Bij een dictee waar het gaat om toepassing van de kennis van de spelling, en in het geval van een verkleinwoord kennis hebben van het achtervoegsel JE, is het meestal niet nodig om de betekenis te kennen om het woord correct te spellen.
Ook bij de 19e meerkeuzeopgave lijkt verwarring te zijn ontstaan. De alternatieven waren: BLADZIJDE, DEKSOL, BRIEFJE en BUURMAN. Het feit dat 78% van de leerlingen wel degelijk in staat was om DEKSEL correct te spellen op het dictee, terwijl 61% dit item aankruiste als incorrect op de meerkeuzetoets moet waarschijnlijk verklaard worden door het feit dat het woord BLADZIJDE, dat overigens volgens Cito niet gespeld hoeft te kunnen worden door leerlingen in midden groep 4, concurreerde met DEKSEL.
De 21e meerkeuzeopgave heeft een vergelijkbaar probleem. Hier moesten de leerlingen kiezen tussen: BOSJE, GOET, SNOEPJE en KANT. De helft van de leerlingen gaf correct aan dat GOET het foutgespelde was en iets minder dan de helft wees KANT als foute spelling aan. Op het dictee was er veel minder twijfel over de schrijfwijze; een ruime meerderheid spelde beide woorden correct. Vermoedelijk zijn de leerlingen tijdens de meerkeuzetoets in verwarring gebracht door de gelijktijdige aanbieding van de alternatieven GOET en KANT.
4 Conclusie
In dit onderzoek stond de vraag uit het werkveld centraal in hoeverre Vervolgmodule 2, een meerkeuzetoets, van de toets Cito Spelling groep 4 een adequate vervanging is van een dictee. Het antwoord op deze vraag is eenduidig: dat is niet het geval, omdat de meerkeuzetoets iets anders blijkt te meten dan het dictee. De leerkracht van de groep leerlingen die in dit onderzoek centraal stond, zou veel foute beslissingen genomen hebben. Namelijk leerlingen extra hulp gegeven hebben voor een bepaalde categorie die ze niet nodig hadden of geen hulp hebben geboden die ze wel nodig hadden. Deze conclusie werd getrokken op basis van empirisch onderzoek waarbij de prestaties op de twee toetsvormen op diverse manieren met elkaar zijn vergeleken. Bovenstaande analyses hebben een aantal belangrijke problemen met het gebruik van een meerkeuzetoets aan het licht gebracht. We zullen ze hier één voor één behandelen.
Het eerste probleem betreft de betrouwbaarheid van de meerkeuzetoets. Deze behaalde niet het vereiste criterium van .80 en was zelfs nog lager dan dat van het dictee over alle woorden (de A-D woorden). Bovendien bleek de betrouwbaarheid van de dicteewoorden (de items uit de herkenningstoets) behoorlijk slecht te zijn te zijn (.66). Als een test niet betrouwbaar is dan kan de uitslag ervan niet gebruikt worden om uitspraken over individuele leerlingen te legitimeren.
Het tweede probleem betreft de criteriumvaliditeit van de meerkeuzetoets. Op basis van de samenhang tussen de scores op de items van de meerkeuzetoets en de scores van dezelfde woorden op een dictee kon vastgesteld worden dat deze gering is (.45). Dit is een eerste aanwijzing dat deze meerkeuzetoets iets anders meet dan een dictee van dezelfde woorden. Ook als de validiteit bepaald werd door de samenhang te berekenen tussen de prestaties op de meerkeuzetoets en de prestaties op alle vier de dictees, liet deze binnen deze steekproef te wensen over.
Het derde probleem dat zich voordoet betreft de bepaling van het spellingniveau dat gemeten wordt met de twee verschillende toetsen. Onze studie laat zien dat de groep gemiddeld genomen slechter presteert op de meerkeuzetoets dan op het dictee.
Een vierde probleem openbaarde zich in de verschillen die zich voordoen tussen de leerlingen. Hoewel gemiddeld genomen de leerlingen het dictee makkelijker vonden dan de meerkeuzetoets, waren er belangrijke individuele verschillen. Voor de meerderheid van de leerlingen (61%) was de meerkeuzetoets inderdaad moeilijker dan het dictee, maar voor een kwart was de meerkeuzetoets makkelijker (22%) en voor de rest van de leerlingen maakte het niet uit (17%) welke toets ze deden.
Een vijfde probleem kwam aan het licht in de analyse naar de consistentie van spellingfouten. Uit de gegevens van Tabel 4 kon worden afgeleid dat er in 25.8% van de spellingen een discrepantie zat. Dat wil zeggen, in 16.0% van de gevallen was de spelling goed op het dictee en fout op de meerkeuzetoets en in 9.8% fout op het dictee en goed op de meerkeuzetoets. Hierbij merken we dan nogmaals op dat het niet precies duidelijk is wat dat betekent fout of goed op de meerkeuzetoets. Op grond waarvan heeft een leerling de keuze gemaakt? Wat we er wel uit kunnen concluderen is dat een leerkracht er niet vanuit kan gaan, dat als de leerling het juiste woord heeft gekozen op de meerkeuzetoets, de leerling het woord ook daadwerkelijk correct kan spellen op een dictee. Het betekent evenmin dat een leerling die niet het foutgespelde item heeft gekozen op de meerkeuzetoets, het woord niet correct kan spellen op een dictee. De antwoorden op de meerkeuzetoets kunnen dan ook niet gebruikt worden als aanwijzingen voor aanvullende instructie (bijvoorbeeld zoals opgenomen in het Hulpboek van de SVS). Als de oefeningen gebaseerd zijn op onjuiste veronderstellingen, dan zijn ze contraproductief. Spontane spellingen of spelling gebaseerd op een dictee geven wel eenduidige informatie over de aan- of afwezigheid van spellingkennis bij leerlingen.
Het zesde en laatste probleem dat we hier aanstippen betreft het feit dat de context van de zin waarbinnen de foute spelling opgespoord diende te worden, de prestaties van de leerlingen ongewenst beïnvloedde. Zo liet bijvoorbeeld de analyse van de eerste meerkeuzeopgave zien dat de ontbrekende kennis van het woord WRAK veel leerlingen hoogstwaarschijnlijk op het verkeerde been heeft gezet. Dit voorbeeld, in samenhang met de andere problemen die besproken zijn, illustreert de zorg die wij hebben bij het gebruik van deze toets. Als het doel is om na te gaan of leerlingen in staat zijn woorden correct te spellen, dan is het belangrijk dat een test ook daadwerkelijk die kennis toetst. Dat betekent dat het maken van de opgaven niet verstoord mag worden door veronderstelde kennis die mogelijk niet aanwezig is (i.c., weten wat en kennis hebben van de spelling van woorden). Omdat de woorden in een zinscontext staan, worden de leerlingen ook gedwongen om te lezen en te begrijpen wat er staat. Lezen is een ander type vaardigheid dan spellen, en het meten van de spellingvaardigheid mag niet vertroebeld worden doordat een test niet zuiver meet. Deze vorm van toetsen, namelijk een meerkeuzetoets aangeboden in een zinscontext, meet niet alleen spelling, maar ook het lees- en begripsniveau. Hierdoor is deze toets geen optimale meting van de spellingvaardigheid van de leerlingen.
Als het doel van spelling op de basisschool is om leerlingen te leren uit het hoofd de correcte spelling van woorden op te schrijven, dan is de meerkeuzetoets uit de nieuwe Spelling van het Cito geen adequaat toetsmiddel. Een dictee voldoet daarentegen wel aan de criteria om deze vorm van spellingvaardigheid te toetsen. Het woorddictee zoals dat nu in de SVS wordt toegepast, is daartoe zeker een geschikt middel. Om nog beter zicht te krijgen op de spellingvaardigheid van leerlingen bevelen wij aan om een zinnendictee toe te voegen aan het bestaande woorddictee. Daarmee kan nagegaan worden of leerlingen de geïsoleerde vaardigheid van het spellen van woorden ook in een praktisch relevante context van een zin dan wel tekst kunnen toepassen.
De resultaten van dit onderzoek hebben een belangrijk gevolg voor de schoolpraktijk. Scholen zouden moeten besluiten om geen meerkeuzetoets toe te passen ter bepaling van de spellingvaardigheid. Het feit dat de Cito-eindtoets een aantal meerkeuzeopgaven heeft die analoog zijn aan de meerkeuzeopgaven zoals hier beschreven mag geen argument zijn om er toe over te gaan. Het zou beter zijn als het Cito de spellingherkenningtoets zoals opgenomen in de eindtoets verandert in een spellingproductietoets, zodat de vaardigheid die men beoogt te toetsen ook daadwerkelijk getoetst wordt.
Noten
Wij danken de leerkracht en de leerlingen van groep 4 van openbare basisschool ‘Schrijvershof’, locatie Kofschip te Zevenaar voor hun bereidwilligheid deel te nemen aan dit onderzoek. Ook zijn wij dank verschuldigd aan drs. Sanne Masselink voor het verwerken van de gegevens. Ben Schraven zijn wij veel dank verschuldigd voor het becommentariëren van een eerdere versie van dit manuscript.
Literatuur
- Bosman, A. M. T., & de Groot, A. M. B. (1992). Differential effectiveness of reading and non-reading tasks in learning to spell. In F. Satow and B. Gatherer (Eds.), Literacy without frontiers (pp. 279-289). Widnes, Cheshire, UK: United Kingdom Reading Association.
- Bosman, A.M.T., & de Groot, A.M.B. (1996). Phonologic mediation is fundamental to reading: Evidence from beginning readers. The Quarterly Journal of Experimental Psychology, 49A, 715-744.
- Brown, A.S. (1988). Encountering misspellings and spelling performance: Why wrong isn't right. Journal of Educational Psychology, 80, 488-494.
- Dixon, M., & Kaminska, Z. (1997). Is it misspelled or is it mispelled? The influence of fresh orthographic information on spelling. Reading and Writing: An interdisciplinary Journal, 9, 483-498.
- Jacoby, L.L. & Hollingshead, A. (1990). Reading student essays may be hazardous to your spelling: Effects of reading incorrectly and correctly spelled words. Canadian Journal of Psychology, 44, 345-358.
- Largy, P., Fayol, M., & Lemaire, P. (1996). The homophone effect in written French: The case of verb-noun inflection errors. Language and Cognitive processes, 11 217-255.
- Ministerie van OCW (2006). Brochure Nieuwe gewichtenregeling basisonderwijs. Zoetermeer: CFI.
- Van Orden, G.C., Stone, G.O., Garlington, K.L., Markson, L.R., Pinnt, G.S., Simonfy, C.M., & Brichetto, T. (1992). "Assembled" phonology and reading: a case study in how theoretical perspective shapes empirical investigation. In R. Frost and L. Katz (Eds.), Orthography, Phonology, Morphology, and Meaning (pp. 249-292). Amsterdam: Elsevier Science Publishers B.V.
- Wijs, de A., Krom, R., & Berkel, S. van. (2006). Leerling- en onderwijsvolgsysteem Spelling groep 4. Handleiding. Arnhem: Cito.