Welke wijze van beoordelen door leraren draagt het meest bij aan de self-efficacy van leerlingen?

Geplaatst op 9 februari 2021

Er is geen duidelijke relatie gevonden tussen manieren van beoordelen door leraren (cijfer, niveauaanduiding, dialoog) en het vertrouwen in eigen kunnen van leerlingen. Wel zijn er aanwijzingen voor een positief verband tussen dat vertrouwen en het gebruik van rubrics – tekst in tabellen om het werk van leerlingen te beoordelen – in combinatie met feedback. Feedback gericht op het proces is hierbij effectiever dan feedback op de prestatie.

Leraren volgen leerlingen tijdens hun leerproces en na een leerperiode met behulp van respectievelijk formatieve en summatieve evaluatie. Het formatief gebruik van summatieve toetsen kan leraren en leerlingen ook informatie geven over de voortgang van het leerproces.

Beoordelen met cijfers, letters, toelichtingen en gesprekken

Leraren kunnen beoordelingen geven met cijfers, letters of een ander type niveauaanduiding, met een mondelinge of schriftelijke toelichting, in een dialoog of door een combinatie hiervan.
Cijfers of letters geven het prestatieniveau van een leerling aan, veelal 1 tot en met 10 of g (goed), v (voldoende), o (onvoldoende). Leraren kunnen mondeling of schriftelijk toelichten waar de leerling staat (feedback), waar de leerling naartoe werkt (feedup) en hoe de leerling naar de gewenste situatie komt (feedforward).

Gesprekken voeren in de klas is voor leraren ook een manier om het leerproces te beoordelen. Zogenoemde educatieve dialogen maken het mogelijk om op een laagdrempelig en informeel niveau het begrip en denken van leerlingen expliciet te maken. Dit kan bijvoorbeeld door leerlingen de leerdoelen en hun sterke kanten en ontwikkelpunten uit te laten leggen.

Beoordelen met rubrics

Een andere beoordelingswijze is werken met rubrics. Een rubric is een tabel waarin succescriteria, niveaubeschrijvingen en/of leerdoelen staan omschreven. De leraar kan die tabel aanvullen met cijfers, letters of andere niveauaanduidingen. Rubrics dragen bij aan het geven van feedback en ze bieden een structuur voor self- en peerassessment. Er zijn verschillende soorten rubrics te onderscheiden: holistische, analytische en single-point rubrics.

Bij een holistische rubric geeft de leraar een totaaloordeel in de vorm van een cijfer, letter of niveauaanduiding. De rubric bevat per niveau een beschrijving van de verwachtingen, waarbij verschillende criteria meewegen. De beoordeling bevat veelal een bekwaamheidsoordeel ten opzichte van een gewenst niveau, zoals gedeeltelijk bekwaam, bekwaam en gevorderd. Wanneer de leraar alle criteria afzonderlijk beoordeelt, is er sprake van een analytische rubric.

Ook single-point rubrics bevatten de verschillende criteria, maar ze beschrijven alleen het voldoendeniveau. Daarnaast is er ruimte voor specifieke terugkoppeling, over waar een leerling zich kan verbeteren en over waar een leerling boven verwachting heeft gepresteerd.

Beoordelingen voorzien van feedback stimuleren het leerproces

Beoordelingen via cijfers dragen bij aan de motivatie en leerprestaties van leerlingen, mits die cijfers gepaard gaan met feedback. Zonder specifieke feedback kunnen er juist negatieve effecten optreden, zoals demotivatie en angst.
Naar het effect van verschillende manieren van beoordelen op het vertrouwen in eigen kunnen van leerlingen is nauwelijks onderzoek verricht. Alleen voor analytische rubrics is een verband gevonden. Het gebruik daarvan heeft een positief effect op leerresultaat en zelfregulatie. Een rubric voor zelfbeoordeling door de leerling is onvoldoende om het vertrouwen in eigen kunnen te vergroten. Aanvullende mondelinge feedback werkt wel. Feedback gericht op het proces heeft daarbij een groter effect dan feedback gericht op de prestatie.

Uitgebreide beantwoording

Opgesteld door: Barbara Janssen (antwoordspecialist) en Lisette Uiterwijk (Kennismakelaar Kennisrotonde)
Vraagsteller: Docent voortgezet onderwijs

Vraag

Welke wijze van beoordelen door leraren (cijfer en/of niveauaanduiding en/of dialoog) draagt het meest bij aan de self-efficacy van leerlingen?

Kort antwoord

Er is geen duidelijk verband gevonden tussen manieren van beoordelen en de self-efficacy van leerlingen. Wel zijn er aanwijzingen voor een positief verband tussen self-efficacy van leerlingen en het gebruik van (analytische) rubrics in combinatie met feedback. Feedback gericht op het proces is hierbij effectiever dan feedback gericht op de prestatie. Onderzoek naar het effect van andere manieren van beoordelen op self-efficacy ontbreekt; de effectiviteit daarvan is dan ook onbekend.

Toelichting antwoord

Leraren volgen leerlingen in hun leerproces tijdens en na een leerperiode met behulp van formatieve en/of summatieve evaluatie. Summatieve toetsen zijn met name gericht op het afsluiten van een leerperiode en het beoordelen van leerprestaties ten opzichte van vooraf gestelde doelen, veelal uitgedrukt in een cijfer. Formatief evalueren is gericht op het leerproces zelf en omvat alle activiteiten van docenten en leerlingen om de leeractiviteiten van leerlingen in kaart te brengen, te interpreteren en te gebruiken om betere beslissingen te nemen over vervolgstappen (Black et al., 1998 in Kennisrotonde, 2017).

Onderdeel hiervan kan ook het formatief gebruik van summatieve toetsen zijn; ook deze kunnen leerlingen informatie geven waar ze staan in hun leerproces (Black et al., 1998; Hattie et al., 2007; Sluijsmans et al., 2013). Voor meer informatie over toetsing zie ook Kennisrotonde (2016a en 2016b; 2017; 2018a en 2018b; 2020).

Verschillende (combinaties van) wijzen van beoordelen mogelijk

Het beoordelen van leerlingen door het geven van een cijfer, een andere type niveauaanduiding, een score op een rubric, een mondeling of schriftelijke toelichting, een dialoog of door een combinatie hiervan, kan zowel summatief als formatief gebruikt worden. Hieronder worden verschillende wijzen van beoordelen besproken.

Beoordelen via cijfers, letters of labels met of zonder aanvullende toelichting

Cijfers geven een totaaloordeel weer.[1] Ze geven het prestatieniveau van een leerling aan, afgezet tegen een rapportageschaal - in Nederland veelal 1 tot en met 10 (Kennisrotonde, 2020). Nadere feedback geven kan in de vorm van een mondelinge of schriftelijke toelichting op het cijfer waarin wordt aangegeven waar de leerling nu staat (feedback), waar de leerling naartoe werkt (feedup) en/of hoe de leerling naar de gewenste situatie komt (feedforward) (Hattie et al., 2007). Ook de rubrics die hieronder aan bod komen kunnen dienen als aanvullende feedback bij een cijfer.

Verschillende manieren van beoordelen via een rubric

Een rubric is een tabel waarin succescriteria, niveaubeschrijvingen en/of leerdoelen helder staan omschreven. Een rubric kan worden voorzien van een totaaloordeel in de vorm van een cijfer, letter, niveauaanduiding of een kwalitatief oordeel. Rubrics kunnen bijdragen aan het geven van doelgerichte en beschrijvende feedback en het bieden van een structuur voor self- en peerassessment (Gulikers et al., 2017). Er worden in de literatuur verschillende soorten rubrics onderscheiden: holistische rubrics, analytische rubrics en single-point rubrics (Balch et al., 2016). We lichten ze hieronder toe.

Bij een holistische rubric geeft de beoordelaar een totaaloordeel in de vorm van een cijfer, letter of niveauaanduiding. De rubric bevat per niveau een beschrijving van de verwachtingen, waarbij verschillende criteria meewegen. Een specifiek voorbeeld van een holistische rubric voor taalonderwijs komt van het Europees Referentiekader voor de Talen (ERK). Leerlingen werken toe naar een taalniveau (A1 tot en met C2) waarvan de vereisten in de rubric staan. De beoordeling bevat hierbij veelal een bekwaamheidsoordeel ten opzichte van een gewenst niveau zoals gedeeltelijk bekwaam, bekwaam en gevorderd.
Bij een analytische rubric worden alle criteria afzonderlijk beoordeeld, eventueel gecombineerd in een totaaloordeel. Panadero (2012, Appendix B) geeft een voorbeeld van een analytische rubric voor het analyseren van een landschap met voor elk criterium afzonderlijk (algemene indruk en perspectief, kenmerken, interpretatie en classificatie) vier niveauomschrijvingen.

Ook single-point rubrics bevatten de verschillende criteria, maar ze beschrijven alleen het voldoende niveau expliciet. Daarnaast is er open ruimte voor specifieke terugkoppeling over waar een leerling nog kan verbeteren en waar een leerling boven verwachting heeft gepresteerd.

Beoordelen via een dialoog

Het voeren van gesprekken in de klas kan voor docenten ook een manier zijn om het leerproces te beoordelen. Ruiz-Primo (2011) benoemt in haar literatuuronderzoek naar het voeren van educatieve dialogen mogelijkheden voor docenten om op die manier laagdrempelig en informeel het begrip en denken van leerlingen expliciet te maken.

Dit kan bijvoorbeeld door leerlingen de leerdoelen en hun sterke – en ontwikkelpunten ten opzichte van de leerdoelen uit te laten leggen (Baxa, 2015). Twee andere voorbeelden zijn klassikale besprekingen van voorbeeldteksten van verschillende kwaliteitsniveaus en op basis daarvan met elkaar een rubric opstellen, en het beoordelen van het eigen of elkaars werk gedurende het proces en daar een gesprek over voeren. Op deze manier kan het begrip van leerlingen worden vergroot over hoe kwaliteit er uit hoort te zien (Kennisrotonde, 2020).

Beoordelingen voorzien van feedback zijn effectief voor het leerproces maar het verband met self-efficacy is onduidelijk

Een reviewstudie van Schildkamp et al. (2014) onderschrijft het belang van feedback bij (formatieve) toetsing voor de motivatie en leerresultaten van leerlingen; wel concluderen zij dat uit onderzoek onvoldoende duidelijk blijkt of de feedback beter mondeling of schriftelijk gegeven kan worden, direct of vertraagd moet plaatsvinden en wie de feedback het best kan geven.
Over de effecten van het beoordelen via een dialoog is geen onderzoek gevonden. Voor het beoordelen via cijfers geldt dat deze bijdragen bij aan de motivatie en leerprestaties van leerlingen, onder voorwaarde dat cijfers gepaard gaan met specifieke nadere feedback (Kennisrotonde, 2019). Zonder die feedback kunnen er juist negatieve effecten optreden zoals demotivatie en angst (Hattie et al., 2007; Gulikers et al., 2017; Kennisrotonde, 2016a, 2018b en 2020). Het verband tussen het beoordelen via cijfers en self-efficacy is onbekend.

Naar het effect van het gebruik van verschillende manieren van beoordelen op de self-efficacy – het vertrouwen in eigen kunnen - van leerlingen is nauwelijks onderzoek verricht; alleen voor het gebruik van analytische rubrics is een verband gevonden.
Panadero et al. (2012) onderzochten het effect van self-assessment door middel van het gebruik van analytische rubrics op leerresultaat, zelfregulatie en self-efficacy bij 120 leerlingen in het vo. Het gebruik van een rubric heeft een positief effect op leerresultaat - gemeten door een toets - en zelfregulatie in vergelijking met een controlegroep (Panadero et al., 2012). Het geven van een rubric voor het uitvoeren van een self-assessment alleen is onvoldoende om de self-efficacy te vergroten.

Aanvullende mondelinge feedback gekoppeld aan de rubric heeft wel een positief effect op de self-efficacy. Feedback gericht op het proces heeft daarbij een groter effect dan feedback gericht op de prestatie (Panadero et al., 2012).
De self-efficacy van meisjes in de lagere klassen van het vo bij de start van een onderzoek naar het gebruik van een analytische rubric bij een self-assessment voor schrijfvaardigheid was hoger dan dat van jongens. Self-efficacy wordt versterkt door self-assessment; het gebruik van een rubric bij het self-assessment blijkt daarbij een positief effect te hebben voor meisjes (Andrade et al., 2009). Of het gebruik van andere typen rubrics een vergelijkbaar effect heeft is onbekend.

Geraadpleegde bronnen

Andrade, H. L., Wang, X., Du, Y., & Akawi, R. L. (2009). Rubric-referenced self-assessment and self-efficacy for writing. The Journal of Educational Research, 102(4), 287-302.
Balch, D., Blanck, R., & Balch, D. H. (2016). Rubrics-sharing the rules of the game. Journal of Instructional Research, 5, 19-49.
Black, P. & William, D. (1998). Assessment and classroom learning. Assessment in Education: Principles, Policy & Practice, 5(1), 7-74.
Baxa, S. (2015). Enhancing students' understanding and revision of narrative writing through self-assessment and dialogue: A qualitative multi-case study. The Qualitative Report, 20(10), 1682.
Estell, J. K., Sapp, H., & Reeping, D. (2016). Work in progress: Developing single point rubrics for formative assessment. In: Proceedings of the American Society for Engineering Education 2016 Annual Conference.
Fluckiger, J. (2010). Single point rubric: A tool for responsible student self-assessment. The Delta Kappa Gamma Bulletin, 76(4), 18.
Gulikers, J. & Baartman, L. (2017). Doelgericht professionaliseren: formatieve toetspraktijken met effect! Wat DOET de docent in de klas? Wageningen: Wageningen Universiteit.
Hattie, J. & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77(1), 81-112.
Kennisrotonde. (2016a). Wat is het effect van cijfers (of studiepunten) op de motivatie van studenten? Kan het geven van feedback de motivatie en leerresultaten van studenten positief beïnvloeden en wat is effectieve feedback? (KR.089). Den Haag: Kennisrotonde.
Kennisrotonde. (2016b). Hoe kan het onderwijs met succes formatieve toetsing inzetten? (KR. 015). Den Haag: Kennisrotonde.
Kennisrotonde. (2017). Wat is er in de wetenschappelijke literatuur bekend over de effecten van formatief evalueren? (KR. 162 en 212). Den Haag: Kennisrotonde.
Kennisrotonde. (2018a). Op welke manieren draagt toetsing maximaal bij aan leerwinst in het voortgezet onderwijs? (KR. 419). Den Haag: Kennisrotonde.
Kennisrotonde. (2018b). Wat weten we over effectief en efficiënt formatief toetsen? (KR. 320). Den Haag: Kennisrotonde.
Kennisrotonde. (2019). Wat is het effect van behalen van veel hoge of lage cijfers op de sociaal-emotionele ontwikkeling van leerlingen in de bovenbouw van het basisonderwijs? (KR. 580). Den Haag: Kennisrotonde.
Kennisrotonde (2020). Wat is het effect van het gebruik van letters/woorden als ‘voldoende’ en ‘ruim voldoende’ op een schoolrapport in plaats van cijfers bij leerlingen in het basisonderwijs? (KR.854). Den Haag: Kennisrotonde.
Panadero, E., Tapia, J. A., & Huertas, J. A. (2012). Rubrics and self-assessment scripts effects on self-regulation, learning and self-efficacy in secondary education. Learning and individual differences, 22(6), 806-813.
Ruiz-Primo, M. A. (2011). Informal formative assessment: The role of instructional dialogues in assessing students’ learning. Studies in Educational Evaluation, 37(1), 15-24.
Schildkamp, K., Heitink, M., Van der Kleij, F. M., Hoogland, I., Dijkstra, A., Kippers, W. & Veldkamp, B. (2014). Voorwaarden voor effectieve formatieve toetsing: een praktische review. Twente: Universiteit Twente.
Sluijsmans, D., Joosten-ten Brinke, D., & Van der Vleuten, C. (2013). Toetsen met leerwaarde: een reviewstudie naar de effectieve kenmerken van formatief toetsen. Maastricht: Universiteit Maastricht.

[1] In plaats van cijfers kunnen ook letters zoals o (onvoldoende), m (matig), v (voldoende), rv (ruim voldoende) en g (goed) of labels zoals kleuren of zon, ster of maan worden geven. Experts zijn het erover eens dat het gebruik van cijfers, letters of labels niet (veel) van elkaar verschilt (Kennisrotonde, 2020).

Heb je vragen over dit thema? Stel ze in de onderwijs community binnen de Wij-leren.nl Academie!