Eisen aan een goede toets

13 december 2019

Op deze pagina staan tips voor het maken van een toets.

  • Maak de toets samen met minstens één collega.
  • Maak de toets voorafgaand aan het behandelen van de stof, zodat alle betrokken collega's weten wat er tijdens de toets van de leerlingen wordt verwacht.
  • Analyseer na afloop de toets. Let vooral op de scores per vraag en de spreiding in de cijfers.
  • Stel zo nodig de toets bij, voor hergebruik.
  • Wees ervan bewust wat je met elke opdracht precies wilt toetsen en waarom je op deze manier toetst.
  • Zorg ervoor dat de opgaven, waar relevant, informatie bevatten over de verlangde lengte van het antwoord en de gewenste vorm.

Een valide, betrouwbare en bruikbare toets moet in ieder geval aan de volgende eisen voldoen:

  • De opdrachten moeten een goede afspiegeling zijn van de behandelde leerstof.
  • Toets wat je wilt toetsen. Met andere woorden: weest je zich bewust van wat je met de opdracht wilt toetsen en waarom je dat op deze manier doet.
  • Maak gebruik van handelingswerkwoorden uit het vak. Het verdient de voorkeur door de leerjaren heen dezelfde handelingswerkwoorden te gebruiken.
  • De vorm van de toetsen moet voor leerling herkenbaar zijn, wat betekent dat de opgaven te herleiden moeten zijn tot voor leerlingen duidelijke leerdoelen.
  • Het moet de leerlingen duidelijk zijn wat er precies van hen wordt verwacht. Is bijvoorbeeld voldoende duidelijk wat van hen verwacht wordt bij vragen als leg uit, toon aan, gebruik in je antwoord de bron.
  • De toets gaat vergezeld van een duidelijk en zo mogelijk eenduidig beoordelingsmodel dat geen verschillende interpretaties mogelijk maakt. Dit laatste is vooral belangrijk als de toets gemaakt wordt door leerlingen van verschillende docenten.
  • Alleen leerlingen die de leerstof beheersen moeten de vragen correct kunnen beantwoorden.
  • De opgaven moeten taalkundig correct zijn. Er mag bij leerlingen geen misverstand ontstaan over de bedoeling van de vraag.
  • De opdrachten mogen geen betrekking hebben op tekstverklaren.
  • De toets moet een juiste moeilijkheidsgraad hebben en onderscheid maken tussen goede en slechte leerlingen.
  • Er moet voldoende spreiding zijn tussen goede en slechte resultaten (hoge standaarddeviatie).
  • De vragen moeten (naar puntenaantal) gelijkmatig over de stof verdeeld zijn, zodat niet één aspect onevenredig veel gewicht krijgt.
  • Het aantal opgaven moet voldoende zijn voor een betrouwbare meting.
  • De opgaven bevatten informatie over de lengte van het gewenste antwoord en de gewenste vorm.
  • Aan een goed antwoordelement wordt één scorepunt toegekend (en niet twee of meer).

Een kwalitatief goede toets voldoet bovendien aan criteria op het gebied van:

  • validiteit;
  • betrouwbaarheid;
  • specificiteit;
  • moeilijkheid;
  • discriminerend vermogen;
  • transparantie;
  • beschikbare tijd;
  • (taal)technische kwaliteit.

1. Validiteit

Bij validiteit gaat het erom of een toets in overeenstemming is met de leerdoelen/toetsdoelen van een leerstofeenheid en de leeractiviteiten van de leerling en of de toets toetst wat getoetst moet worden. Bij validiteit wordt onderscheid gemaakt tussen inhoudsvaliditeit en begripsvaliditeit.

Inhoudsvaliditeit wil zeggen dat de toets de behandelde leerstof op verantwoorde wijze afdekt. Hier is de koppeling tussen het leerdoel van het onderwijs en de toets essentieel. Welke kennis moet een leerling in het voorafgaande onderwijs verworven hebben? Wat moet hij met die kennis kunnen doen? Voorafgaand aan het opstellen van de toets moet dat goed in kaart gebracht worden. De kunst is vervolgens om de toetsvragen evenwichtig over de leerdoelen te verdelen. Dekt de toets de behandelde leerstof, zijn de vragen evenwichtig over de gehele stof verdeeld? Komen in een opdracht wel alle aspecten van het geleerde aan de orde?
Bij het bepalen van de inhoudsvaliditeit van een toets of opdracht kan het gebruik van een toetsmatriis behulpzaam zijn. Daarin wordt vastgelegd welke inhoudsaspecten bevraagd worden, in welke verhouding die inhoudsaspecten aan de orde komen en op welk niveau die inhoudsaspecten aan de orde komen. Bij de vraag op welk (denk)niveau de inhoud beheerst moet worden, kan de gereviseerde taxonomie van Bloom (Anderson, Krathwohl, Mayer (2001) van dienst zijn.


Begripsvaliditeit wil zeggen dat de toets toetst wat hij moet toetsen. Dat lijkt een vanzelfsprekendheid, maar lang niet alle toetsen zijn begripsvalide. Een voorbeeld: in een toets over de Koude Oorlog staat een opdracht bij een Engelstalige bron. Als de leerlingen de Engelse taal voldoende machtig zijn om de bron volledig te doorgronden, is er geen probleem. Als dat niet het geval is, toets je niet de historische kennis van de leerlingen, maar de taalvaardigheid in het Engels. De vraag is dan niet begripsvalide.

2. Betrouwbaarheid

Bij betrouwbaarheid spelen twee belangrijke vragen een rol:

  1. Komen verschillende beoordelaars tot dezelfde beoordeling van het werk van een leerling?
  2. Worden vergelijkbare prestaties hetzelfde beoordeeld?

Veel hangt af van de kwaliteit van de vraagstelling en de kwaliteit van het antwoord- of beoordelingsmodel. Bij een gesloten vraagstelling speelt de betrouwbaarheidsvraag minder dan bij een open vraagstelling, omdat bij een gesloten vraagstelling het gewenste antwoord vaak van tevoren vastgesteld kan worden. Bij een open vraag of opdracht komt het aan op een heldere vraag- of probleemstelling die precies aansluit op de gewenste leerdoelen. Ook is het belangrijk bij open vraagstelling veel aandacht aan het antwoord- of beoordelingsmodel te schenken.

Als het antwoord- of beoordelingsmodel is opgesteld, kan vervolgens gecontroleerd worden of de vraag of opdracht uitnodigt om het goede antwoord te geven of om het gewenste gedrag te vertonen.

Een goede, maar wel tijdrovende, manier om tot een betrouwbaar beoordelingsmodel te komen is de volgende. Twee docenten kijken het werk van een paar leerlingen na en stellen daarna in overleg het definitieve antwoordmodel op. In dit model wordt niet alleen aandacht besteed aan wat goed gerekend moet worden, maar, en dat is vaak minstens zo belangrijk, aan wat uitdrukkelijk niet goed gerekend mag worden.

3. Specificiteit

Een toets of opdracht is specifiek als een leerling pas een goede prestatie kan leveren als hij de vastgestelde leerdoelen heeft bereikt, met andere woorden: als hij de leerstof beheerst.

Bij veel toetsen worden bronnen of teksten gegeven waarbij vervolgens vragen worden gesteld. Als die vragen beantwoord kunnen worden door de tekst of de bronnen goed te lezen, zijn die vragen niet (vak)specifiek. Ook als leerlingen de stof niet beheersen, kunnen zij op basis van hun leesvaardigheid de vragen beantwoorden.

4. Moeilijkheid

Het niveau van de toets moet passen bij het gewenste niveau van de leerling en het gevolgde onderwijs. Dat houdt in dat een toets in zijn totaliteit niet moeilijker mag zijn dan de oefeningen die een leerling ter voorbereiding op de toets heeft gemaakt. Natuurlijk mag er best een vraag in de toets zitten die de betere leerling de kans geeft om zich te bewijzen, maar het niveau van de toets in zijn totaliteit moet aansluiten bij het niveau van het voorafgaande onderwijs.

5. Discriminerend vermogen

De toetst maakt het verschil zichtbaar tussen leerlingen die de stof beheersen en leerlingen die de stof niet beheersen en tussen 'goede' en 'minder goede' leerlingen.

6. Transparantie

In het onderwijs dat aan de toets of opdracht voorafgaat is het de leerling duidelijk geworden wat van hem wordt verwacht en hoe er getoetst zal worden. Als de leerling de toets gaat maken, is het hem duidelijk hoe zwaar de verschillende vragen of opdrachten wegen en wat er precies van hem verlangd wordt.

7. Beschikbare tijd

Een toets moet binnen de beschikbare tijd te maken zijn.

8. (Taal)technische kwaliteit

Het is van belang om erop te letten dat de leerlingen bij het maken van een toets of een examen geen fouten zullen maken als gevolg van een voor hen te moeilijk of te vaag taalgebruik. Daarbij is het balanceren op een dun draadje, omdat het taalgebruik wel moet passen bij het niveau dat leerlingen op het moment van de toets zouden moeten hebben. Het is niet de bedoeling dat het taalgebruik bewust simpel gehouden wordt. Ook op dit punt is een goede voorbereiding van de toets in het voorafgaande onderwijs belangrijk.

9. Toetstechnische kwaliteit

Het kan zinvol zijn om de lay-out van (schoolexamen)toetsen zoveel mogelijk te laten lijken op de examens van Cito. De opmaak die vanaf 2013 door Cito wordt gebruikt is: Arial 12; regelafstand exact 14 (instellen via opmaak - alinea).

Aanwijzingen voor de vormgeving van de toets

  • Nummer de vragen en de bladzijden.
  • Druk de opgave op één bladzijde af.
  • Zorg ervoor dat tekeningen en schema's goed leesbaar zijn.
  • Vermeld per vraag het aantal te behalen punten (bij schriftelijke toetsen).​