Definitie
Hallucineren is het AI-fenomeen waarbij een taalmodel met volle overtuiging onjuiste informatie verzint: een wettelijke bepaling die niet bestaat, een boekomslag die nooit geschreven werd, een citaat dat de auteur nooit uitsprak. De output ziet er taalkundig correct uit, maar mist een feitelijke basis.
De oorzaak zit in hoe LLM’s werken: ze voorspellen het meest waarschijnlijke volgende woord op basis van patronen in trainingsdata. Ze hebben geen feitendatabase, geen ingebouwde mechaniek om twijfel te uiten en geen besef van wanneer ze fantaseren versus rapporteren. Voor het model is alles taal-statistiek.
Waarom het ertoe doet voor MKB
Voor MKB-bedrijven die AI inzetten richting klanten of voor besluitvorming is hallucineren het grootste risico. Een chatbot die een fictief retourbeleid noemt, een offerte-assistent die uitvindt dat een product een feature heeft die niet bestaat of een juridische tool die een onbestaande wet citeert. Eén keer fout in productie kan een schadeclaim of een breed gedeelde screenshot opleveren.
Het lastige: hallucinaties komen voor met dezelfde stelligheid als correcte antwoorden. Eindgebruikers herkennen het verschil niet, zeker niet in vakgebieden waarin ze zelf geen expert zijn. Dat maakt het noodzakelijk om guardrails, verificatie en bronvermelding standaard in te bouwen, niet als extra optie.
Concreet voorbeeld
Een groothandel in elektrotechniek (4.500 SKU’s, 600 leveranciers) lanceerde een AI-chatbot voor zijn webshop. In de pilot beantwoordde de bot 92% van de vragen correct. Na livegang bleek de bot bij specifieke specificaties (max-amperage, certificering) regelmatig getallen te verzinnen die plausibel maar fout waren. Een installateur bestelde op basis daarvan 80 schakelaars die niet voldeden, retourkosten €1.400.
De aanpassing: de bot werd herbouwd met RAG bovenop de eigen productdatabase als enige bron, met expliciete instructie om alleen op basis van de meegegeven productdata te antwoorden en anders door te verwijzen naar een collega. Hallucinaties op specificaties zakten naar bijna nul, het percentage “geen zekerheid, doorverwijzen” steeg naar 14%. Die 14% wordt nu opgepakt door een commerciele binnendienst. Effect: minder retouren, hogere conversie en een chatbot waar klanten op durven leunen.
Misverstanden en valkuilen
- “Het nieuwste model hallucineert nauwelijks nog.” Recente modellen zijn beter, maar hallucinaties verdwijnen niet. Bij specifieke feiten, recente gebeurtenissen en niche-onderwerpen blijft het probleem groot. Algemene benchmarks zeggen weinig over jouw use case.
- “Met een goede prompt los je het op.” Prompts helpen, maar lossen het structurele probleem niet op. Een model dat onder druk staat (lange context, vage vraag) valt terug op verzonnen patronen, ongeacht de instructie “alleen feiten”.
- “Dan zetten we er een disclaimer onder.” Juridisch dekt dat soms iets af, maar reputatieschade en klant-frustratie niet. Bij externe communicatie is het standaard om verifieerbaar te zijn, niet om disclaimers te plakken.
- “Hallucineren komt door slechte trainingsdata.” Het komt ook voor bij perfect getrainde modellen, simpelweg omdat het mechanisme woord-voorspelling is, geen feitencheck. Architectuur, niet alleen data, bepaalt het.
Wanneer moet je hiervan wakker liggen, wanneer niet
Wakker liggen: als jouw AI-toepassing extern is (klanten, leveranciers, publiek) of advies geeft waarop beslissingen worden gebaseerd (financieel, juridisch, medisch, technisch). Zonder bron-verificatie, RAG of menselijke review zit je in de hoek waar de schadeclaims wachten. Hoge stakes vragen om hoge controle.
Niet wakker liggen: als AI bij jou ondersteunt bij creatieve of brainstorm-taken waarbij de mens altijd de finale check doet: e-mailconceptjes, eerste-versies, ideeen-generatie. Een hallucinatie is dan een ergernis, geen risico. De mens met domeinkennis blijft het filter.
Gerelateerde termen
- LLM: het type model waarbij hallucineren als fenomeen ontstaat.
- RAG: de meest gebruikte techniek om hallucinaties te beperken door feiten op te halen uit een eigen bron.
- Prompt engineering: instructies en patronen om gegrond te blijven bij gevoelige vragen.
- Generative AI: de bredere categorie AI waarin dit risico structureel speelt.
- Embedding: techniek achter RAG om de juiste bronnen op te halen.
- NLP: het vakgebied dat naar hallucineren onderzoek doet vanuit taalmodellering.