De stand van het standaardwerk: in gesprek met Heleen Kleiboer over de toekomst van het Groot woordenboek van de Nederlandse taal.

De Dikke Van Dale is nu al ruim 160 jaar het standaardwerk van de Nederlandse taal. Bij schrijvers, journalisten, studenten, maar ook de gewone lezer staat doorgaans een exemplaar in huis. Maar hoe komt dit standaardwerk tot stand? En kan ‘de Dikke’ standhouden in tijden van digitalisering en generatieve taalmodellen? Heleen Kleiboer, redacteur bij Van Dale, denkt van wel.

Je omschrijft je functie als: ‘Het signaleren en beschrijven van ontwikkelingen in de Nederlandse taal, zodat ze uiteindelijk in het woordenboek kunnen komen.’ Heb je een voorbeeld van iets dat je hebt gesignaleerd dat nu in het woordenboek staat?

‘Het allereerste woord dat ik ooit in het woordenboek heb verwerkt was “dragking”. “Dragqueen” stond al heel lang in de Van Dale, maar ik was eens uit geweest en het hoort bij het werk van een redacteur dat je overal waar je gaat een soort van nieuwsgierigheid moet hebben naar alles wat je hoort. Wat betekent dit woord precies? Zou het al in de Van Dale staan? Hoe zou het in de Van Dale staan? Dus toen ik eens ergens was waar er sprake was van een dragking, dacht ik: zou dat al in de Van Dale staan? Dat bleek van niet. Toen heb ik meteen de omschrijving van dragqueen aangepast. De oude definitie was uit mijn hoofd iets van: “Een man die zich graag kleed als vrouw.” Terwijl: er zijn ook dragqueens die geen mannen zijn, maar wel dragqueens. Toen heb ik die definitie ook wat bijgewerkt. Dus eigenlijk moet je overal waar je gaat je ogen en oren openhouden.’ 

Horen, registreren, meenemen dus?

‘Ja, dat is het eigenlijk wel. In het woordenboek registreren we, de taalkunst gebruiken we. Het is eigenlijk enorm bezig zijn met taalgebruik en sensoren ontwikkelen voor wanneer taal gebruikt wordt op een manier waarvan je denkt: hé, dat is nieuw.’ 

Dus jij hoort dat, neemt het mee hoe gaat dat verder op ‘de redactie’?

‘Bij sommige woorden is het heel duidelijk. Ik weet niet meer precies welk woord het was, een van de melkalternatieven. Amandelmelk, sojamelk, of zo. Die er dan niet in stond, en havermelk dan wel. Of andersom, maar dan zeggen we: “Ja, die doen we er ook bij.” Want dan komt het woord zo veel voor nu, dat is ingeburgerd. Maar het is ook belangrijk dat het woorden zijn die in verschillende lagen van de maatschappij voorkomen. Vaktaal, of jargon dat maar door een heel specifiek soort mensen wordt gebruikt, dat hoeft dan niet per se in het algemene woordenboek van de Nederlandse taal. Daarom hebben we ook een redactie die is samengesteld uit verschillende soorten mensen met verschillende interessegebieden, die met elkaar in overleg gaan.’

Op de site vermelden jullie dat jullie in bijvoorbeeld krantenartikelen en websites zoeken. In hoeverre zijn die ‘gevonden’ woorden contextgebonden, waar ligt de grens met bijvoorbeeld jargon?

‘Er zijn wel woorden die in een specifiek jargon één betekenis hebben, maar die ook breder gedragen worden. “Diabetes” is daar een voorbeeld van. Dat was ooit een term die alleen dokters kenden, alle andere mensen kenden dat toen als suikerziekte. Maar tegenwoordig is diabetes een veel breder verspreide term die veel mensen kennen. Die staat dus inmiddels ook in het woordenboek. Maar er zijn natuurlijk meer voorbeelden van vaktermen die voor niet iedereen relevant zijn.’

In muziek wordt veel met taal gespeeld, hoe gaat de redactie daarmee om?

‘Dat is ook onderdeel van de algemene taken van een redactielid. Media consumeren, zullen we maar zeggen. Om ook daarin op te blijven letten. Als er een woord is dat in een nummer gecreëerd wordt, dan is het pas interessant voor het woordenboek als het door meerdere mensen wordt gebruikt. Gaat het verder dan dat nummer, wordt het door taalgebruikers omarmd, dan signaleren we het op meerdere plekken. Maar het is dan wel opletten als je het bijvoorbeeld terugziet in de krant; of het niet één journalist is die met een term komt of een term bespreekt. Maar op het moment dat je merkt dat het door meer mensen, ook andere delen van de maatschappij gebruikt wordt, dan kan het interessant zijn om naar te kijken.’

Hoelang duurt het gewoonlijk, dat proces van horen, registreren en meenemen?

‘Het is erg variabel bij ons, bij sommige andere woordenboeken is dat anders. Maar het is tegenwoordig heel anders dan vroeger. Toen het woordenboek net uitkwam, kwam er één keer in de acht jaar een nieuw woordenboek uit. Dan kon het dertig jaar duren voordat een woord zo ingeburgerd was dat het in het woordenboek kwam. Dat kwam dus én omdat het woordenboek niet zo vaak uitkwam én omdat taal zich minder snel verspreidde. Maar nu, met sociale media en massamedia, verspreidt en ontwikkelt taal zich veel sneller. Dan is het vaak wel even afwachten of het niet een trendwoord is. We hebben het op de redactie laatst nog over “labubu” gehad. Maar daarvan denk ik zelf dat niemand het er nog over heeft over een paar maanden.’

De Van Dale is daarin ook redelijk veranderlijk, zo stond er in de veertiende editie bijvoorbeeld nog een lijst met persoonsnamen uit Rome. Er verdwijnt, zoals in de taal, ook een hoop uit de Van Dale.

‘Ja, zeker met de papieren boeken. Daarin zit gewoon beperkt ruimte. Het heet de ‘Díkke’ Van Dale, maar het woordenboek is zeker niet eindeloos. Er gaat een enkele keer wel eens een woord uit, dat echt niet meer gebruikt wordt. Maar met de online versie hebben we dat probleem niet, omdat we daar veel meer ruimte hebben. Daar kunnen oude woorden die niet meer gebruikt worden gewoon in blijven staan. Als je bijvoorbeeld een heel oud boek als Max Havelaar leest, is het toch fijn als je woorden die daarin staan nog kan opzoeken.’

Tot 10 december 2025 was er een gratis online versie van de Van Dale, naast de reguliere, betaalde versie. Nu ligt jullie focus geheel op de betaalde variant. 

‘Ja, de veertiende editie van het woordenboek is volledig online geplaatst en sindsdien verder ontwikkeld. Sindsdien lopen de uitgaven ook niet helemaal meer gelijk, op het internet hebben we meer woorden staan dan in de fysieke editie. We kunnen er gewoon meer vormen, samentrekkingen in kwijt. Meer informatie, die in de papieren versie niet past. De gratis versie die we hadden, die was dus altijd al minder uitgebreid.’

Jullie maken dus ook nog, in tegenstelling tot bijvoorbeeld de Encyclopaedia Brittanica, een fysieke versie. Is dat houdbaar?

‘Dat moet nog blijken. De meest recente papieren editie is in 2022 uitgekomen, en we hebben nog geen datum in zicht voor een volgende papieren editie. Maar als er genoeg veranderd is in het woordenboek om het de moeite waard te maken om een nieuwe fysieke editie uit te brengen, kan die er zeker wel komen. Voorlopig focussen we volledig op de online editie.’

Zijn er meer voordelen aan een online editie vergeleken met een fysieke editie?

‘Ja, het gaat sowieso veel sneller, natuurlijk. In plaats van een van de drie boeken openslaan en bladeren tot het juiste woord, kan je met de online editie actiever zoeken. Je kan bijvoorbeeld ook doorklikken op de woorden die in de definitie worden gebruikt om op de definitie van dát woord te komen. Je krijgt ook een voorbeeldzin en een doorverwijzing naar elk ander artikel waar het gezochte woord is genoemd. Je kunt er gewoon veel meer mee. Je zoekt één woord op, en je krijgt gelijk alle uitdrukkingen waarin dat woord gebruikt wordt. Mensen wisten ook niet precies het verschil tussen de online versies. Dan stond er in allerlei artikelen: ‘volgens de Dikke van Dale…’, en dan kwam dat uit de gratis versie, die al verouderd was.’

Transformeren jullie van standaardwerk naar ‘standaardsite’, in plaats van een Van Dale in de kast naar een tabblad dat altijd openstaat?

‘Ja, voor mij is dat eigenlijk al zo. ’s Ochtends open ik mijn Gmail en mijn Van Dalepagina. Een soort standaardpagina inderdaad.’

Ten tijde van dit interview hebben jullie net het Woord van het Jaar uitgebracht. Dat doen jullie al even, maar de positie als standaardwerk is bedoeld of onbedoeld ook een soort maatschappelijke graadmeter geworden. Dat komt vooral opborrelen met het Woord van het Jaar. Zo verschenen in NRC en de Volkskrant artikelen over wat het Woord van het Jaar zegt over de maatschappij. Bij WNL klaagde schrijver Kluun over het woord. Er is iedere keer toch weer reuring. Hoe verklaar je dat?

‘Je ziet dat inderdaad bij alle woordenboeken. We kijken natuurlijk ook naar de Amerikaanse en Engelse woordenboeken. Daar was het woord bijvoorbeeld bij het Oxford English Dictionary ragebait en slop bij woordenboek Merriam-Webster, die vind ik zelf ook wel heel goed. Mensen houden er toch aan het einde van het jaar van om een beetje een terugblik op het jaar te hebben. Bijvoorbeeld Spotify Wrapped,en ik kreeg ook een Rabobank-terugblik, dat wil ik helemaal niet zien! Maar goed, mensen vinden het gewoon leuk om terug te kijken, aan het einde van het jaar. Het is ook altijd als er een woord-van-het-jaar-verkiezing is, dat je dan een selectie van woorden ziet waaruit blijkt: dit is waar de mensen mee bezig waren dit jaar.’

Dit jaar kozen jullie ‘hallucineren’, hoe kwamen jullie tot die keuze?

‘We komen in principe allemaal met een paar kandidaten. Dan leggen we uit waarom we denken dat dat het woord moet zijn, zowel in Nederland als in België. Daarover gaan we dan in overleg en dit jaar kwamen we uit op “hallucineren”. 

Het Woord van het Jaar werd ooit met een publieke stemming geselecteerd. Daar zijn jullie vorig jaar mee gestopt door een ‘onprettige maatschappelijke discussie’.

‘Die maatschappelijke discussie is er altijd al geweest. Er zijn ook vaak woorden geweest waar veel mensen veel meningen over hadden. “Prikspijt” in 2021 vond niet iedereen leuk. Vorig jaar was het haast schokkend om te merken dat de politieke discussie zo verhard en zo agressief is geworden dat het eigenlijk geen doen meer is. De manier waarop mensen communiceren over dit soort dingen is heel erg ontwikkeld, of heel erg fel geworden. Het is een lastige positie om te hebben. We zijn in principe een woordenboek voor iedereen, daarom moeten we ook neutraal zijn. Maar met een publieke stemming is het dan lastig als mensen via het woordenboek proberen een mening door te drukken.’

Het lijkt ook op te lopen, in 2007 was het nog ‘bokitoproof’. Naarmate je verder komt wordt het ‘klimaatklever’, ‘sjoemelsoftware’, ‘prikspijt’ en dan nu ‘hallucineren’. Dat is een bijgevoegde betekenis van een bestaand woord, dat wordt toegevoegd vanwege AI en hoe we daarover praten. Merk je als redacteur veel ontwikkeling in het taalgebruik rondom AI?

‘Je merkt wel vaak als je iets leest een bepaalde eenheidsworst, waarvan je denkt: volgens mij is dit geschreven door AI. Als ik op zoek ben naar taalontwikkeling staat er in een door AI gegenereerd artikel niks interessants. De inhoud kan nog wel interessant zijn, maar het taalgebruik niet. Het is gewoon gebaseerd op heel veel andere taal die er al was, samengesmeed tot een soort eenheidsworst. Ik vind dat zelf, ook als vertaler, erg zonde. Dat er gewoon zoveel saaie teksten worden “geschreven”. Je hebt in het online woordenboek ook een optie om synoniemen te vinden. Een van de dingen die AI altijd doet: alles in opsommingen van drie. Dat heb ik ook zelf geleerd, in taalkunde als stijlfiguur, maar bij AI zie je het echt overal. Altijd die opsomming van drie. In die zin denk ik dat ze wel steeds synoniemen gebruiken, maar vooral gewoon heel veel woorden gebruiken die heel weinig betekenen.’

Fungeert de Van Dale als woordenboek, iets waarmee we de taal categoriseren en vastleggen, waarmee we mensen terugfluiten van ‘zo doen we dat niet, dit is hoe we de dingen schrijven’, niet ook als een soort rem op de taal? 

‘Veel mensen gebruiken de Van Dale wel om discussies over spelling uit te vechten. Maar in principe beschrijven we natuurlijk altijd de taal. In taalkunde noemen we dat “descriptief” in plaats van “prescriptief”. We beschrijven alleen hoe de taal gebruikt wordt, we schrijven het niet voor. Maar als er bijvoorbeeld een leenwoord uit het Engels komt, dan wordt dat wel vaak aangepast aan de Nederlandse spelling. Bij werkwoorden gaat dat heel snel. Bij “uploaden” en “downloaden” bijvoorbeeld, daar komt dan een -en achter om er een Nederlands werkwoord van te maken. En dan kijkt de Van Dale natuurlijk wel naar de officiële spellingregels van het Groene Boekje. Bij woorden die de- en het-woorden zijn, of bijvoorbeeld het gebruik van hen/hun, die tegenwoordig helemaal niet meer zo streng zijn. Dat is het beleid van een levende taal. Daar kun je dan met de regels alleen maar achteraan blijven gaan, dat kan je niet voorschrijven.’

De Van Dale heeft zich in vergelijking met de Brittanica redelijk goed door de vorige grote dreiging, het internet, geslagen. AI met bijvoorbeeld  ChatGPT is dan weer ‘het nieuwe ding’. Is ChatGPT een concurrent voor jullie?

‘Concurrent niet zozeer. Het is wel iets wat steeds meer opkomt, en mensen gebruiken wel graag ChatGPT om dingen aan te vragen. Maar tijdens je studie zal je toch ook tegenkomen – mag ik toch aannemen – dat het vinden van betrouwbare bronnen nog altijd heel belangrijk is. De Van Dale is natuurlijk wel betrouwbaar op het gebied van taal en spelling. ChatGPT heeft die betrouwbaarheid niet. Die genereert stukken met berekeningen van “welk woord komt hier waarschijnlijk achter?” maar echte kennis heeft het zelf niet. Waar we het net ook over hadden: woordenboeken hebben de taak om neutraal te blijven. Dat is ook iets waar we bewust mee bezig zijn. Er is menselijke kennis en inschattingsvermogen nodig om bronnen te lezen en te denken: is deze bron volledig neutraal? Kan ik deze informatie gebruiken?, waar ChatGPT gewoon alle bronnen gebruikt die je hem geeft. Nooit bewust, het is natuurlijk geen bewustzijn. Je kunt er dan niet van uitgaan dat het zomaar neutraal is. Daarbij, wat wij bij het woordenboek doen: als er een nieuw woord is, moeten we daar een nieuwe definitie bij schrijven. Dan maak je echt iets nieuws. En dat kan ChatGPT ook niet. Een tijd geleden had een redacteur bij wijze van test het woord “zevenvinker”, geïntroduceerd door Joris Luyendijk, aan ChatGPT gevraagd: “Kun je mij een definitie van een zevenvinker geven?” Toen kwam het volgens mij met een vogel uit de vinkenfamilie. Het bestond nog niet, dat woord. Dus toen ‘dacht’ chat: een vink, dat ken ik, daar kan ik wat mee. Nu, nadat er een hele hoop artikelen over zijn geschreven, komt ChatGPT wél met een definitie. Het loopt dus in feite altijd achter. Ik las in de trein een artikel over een interessant onderzoek, waarin  ChatGPT patronen slechter herkent dan dat achtjarigen dat doen. Daarin stond ook: “Kennis flexibel toepassen in nieuwe situaties blijft voorlopig een kenmerk van menselijke intelligentie.” Dat vond ik heel mooi gezegd. Dat is in principe waar AI tekortschiet. Dat kan een generatief taalmodel niet, het is geen wezen, het is een wiskundige formule. Die kan niet zelf echte keuzes maken, en dat is dan toch nog wel de kracht van menselijke intelligentie.’ 

Studenten aan de UvA hebben gratis toegang tot het online woordenboek van Van Dale.

Tekst Job Korten, beeld Micha De Wandeler

Plaats een reactie