Ontdek de Verrassende Verschillen Tussen AI-gegenereerde en Menselijke Teksten!

Het is inmiddels drie jaar geleden sinds ChatGPT zijn intrede deed in de wereld, wat een revolutie teweegbracht in iedere industrie waar schrijven en lezen centraal staan. Bij de lancering werden al snel pogingen ondernomen om de “vingerafdrukken” van AI in teksten te detecteren. De detectiemethoden kunnen worden onderverdeeld in lokale methoden, die proberen vast te stellen of een stuk tekst door AI is gegenereerd, of globale methoden, die niet op het niveau van een individueel artikel werken, maar eerder linguïstische trends in AI-gegenereerde teksten analyseren.

Een aantal voor de hand liggende aanwijzingen dat een artikel door AI is geschreven, zijn verzonnen referenties of per ongeluk opgenomen zinnen zoals “Als een AI-taalmodel”. De meeste keren zijn echter meer geavanceerde methoden nodig. Enkele van deze methoden zijn gebaseerd op een statistische maat genaamd perplexiteit, die in wezen meet hoe verrassend een reeks woorden is. AI-gegenereerde teksten hebben de neiging om lagere perplexiteit te vertonen, wat betekent dat ze voorspelbaarder zijn dan menselijke teksten.

Andere methoden zijn gebaseerd op het concept van watermerken, een proces dat een signaal in de gegenereerde tekst verbergt. Daarnaast worden machine learning-algoritmen ingezet om patronen te herkennen die AI-gegenereerde en menselijke tekst van elkaar kunnen onderscheiden. Hoewel deze technieken voortdurend verbeteren, zijn ze nog niet betrouwbaar genoeg voor praktischer gebruik. Het grootste probleem is het potentieel voor valse positieven: een leerling kan ten onrechte beschuldigd worden van het gebruiken van AI voor een opdracht.

De globale benadering voor het opsporen van AI in teksten probeert woorden, zinnen of syntactische patronen te vinden die geassocieerd worden met AI-geschreven teksten. Er zijn twee belangrijke manieren om dit te doen: tekst vergelijken die vóór en na 2022 is geschreven, en/of tekst die we weten dat door een persoon is geschreven vergelijken met teksten waarvan we weten dat ze AI-gegenereerd zijn.

Soms kunnen dramatische toename in de populariteit van een woord worden verklaard door wereldgebeurtenissen, zoals woorden gerelateerd aan de pandemie, bijvoorbeeld omicron. Soms ontbreekt echter een duidelijke verklaring, wat doet vermoeden dat ChatGPT of andere taalmodellen een rol spelen. De zin “I rise to speak”, die door Amerikaanse politici wordt gebruikt, heeft een opmerkelijke toename in populariteit gezien onder Britse politici, zo blijkt uit een analyse van recente toespraken in het Britse parlement. Misschien is de bekendste ontdekking uit dit onderzoek ChatGPTs blijkbare voorkeur voor het woord ‘delve’ in wetenschappelijke teksten.

Een probleem bij het begrijpen van de impact van ChatGPT op schrijven is dat we achter een bewegend doel aanjagen. De modellen achter ChatGPT veranderen om de paar maanden, en de bedrijven die deze modellen ontwikkelen proberen ze steeds menselijker te maken. Dus als ‘delve’ een indicatie is voor AI-gegenereerde teksten, kunnen de AI-modellen zo worden aangepast dat antwoorden die ‘delve’ bevatten niet langer worden geprefereerd; of ChatGPT-gebruikers kunnen instructies in hun prompts opnemen om het woord te vermijden.

Om dit punt te illustreren, toonde een recente studie van de Washington Post, die meer dan 300.000 ChatGPT-berichten van juni 2024 tot juli 2025 analyseerde, aan dat het gebruik van ‘delve’ door ChatGPT aan het afnemen is. Tegelijkertijd verandert Generative AI het menselijke schrijven. Veel mensen zijn wantrouwig ten opzichte van AI en kunnen woorden vermijden die ze associëren met AI wanneer ze schrijven. Anderen kunnen deze woorden vaker gebruiken omdat ze subtiel worden beïnvloed door de AI-gegenereerde artikelen die ze lezen. Het is niet eenvoudig om deze verschillende factoren uit elkaar te halen.

Een indrukwekkende 70% van alle geanalyseerde ChatGPT-berichten bevatte een emoji, waarbij ongeveer een derde het ✅-symbool bevatte. Dus wat zijn ChatGPTs nieuwe favoriete woorden? Volgens de studie van de Washington Post zijn de nieuwe favorieten van ChatGPT ‘core’ en ‘modern’. Emojis zijn ook populair, vooral de hersenemojie 🧠 en het vinkje ✅. De zin ‘not just X, but Y’ neemt toe, evenals informele samentrekkingen zoals ‘it’s’ en ‘you’re’. Het streepje (—) blijft ook in populariteit toenemen.

Dus, hoe kunnen we met zekerheid weten dat iets door een persoon is geschreven? Het enige wat we kunnen doen, is blijven graven in het kernonderzoek van deze volledig moderne puzzel ✅🧠.