Na de lancering van ChatGPT in november 2022 is de fenomenale AI-chatbot uitgegroeid tot een van de meest vertrouwde schrijftools op internet. Het is eenvoudig te gebruiken; beschrijf wat je moet schrijven en ChatGPT drukt het binnen enkele seconden op het scherm af.

In een tijdperk waarin door AI gegenereerde tekst wordt doorgegeven als door mensen geschreven en wordt gebruikt om een ​​oneerlijk voordeel te behalen, is het identificeren van AI-inhoud erg belangrijk. Maar ChatGPT kan AI-inhoud niet nauwkeurig herkennen, zelfs niet zijn eigen werk, maar waarom?

Is er een verschil tussen AI-tekst en menselijk schrijven?

Een voorwaarde voor ChatGPT om zijn eigen schrijven of door AI gegenereerde tekst te herkennen, is dat er een verschil moet zijn tussen het en door mensen geschreven tekst. Dus, is er een significant verschil tussen door mensen geschreven tekst en door AI gegenereerde inhoud? Als die er is, zou een tool als ChatGPT het zeker moeten kunnen onderscheiden.

We schreven een kort verhaal zonder enige input van een AI-tool en vroegen vervolgens aan ChatGPT of het verhaal door AI geschreven inhoud was. ChatGPT markeerde het vol vertrouwen als een door AI gegenereerde tekst.

instagram viewer

Vervolgens hebben we ChatGPT gevraagd om een ​​verhaal te genereren, en in diezelfde chatthread hebben we de gegenereerde tekst gekopieerd en geplakt en aan ChatGPT gevraagd of de tekst door AI was gemaakt. ChatGPT's reactie? Een zelfverzekerd "Nee."

ChatGPT slaagde er in beide gevallen niet in om door mensen geschreven of door AI gegenereerde tekst te identificeren. Dus hoe komt het dat ChatGPT zijn eigen tekst niet kan detecteren? Betekent dit dat er geen verschil is tussen AI en menselijke tekst?

Nou, dat is er. We zouden een heel boek kunnen schrijven over het verschil tussen de twee, maar dat maakt niet veel uit. Dus als er een verschil is, waarom kan ChatGPT of een andere AI-tool deze verschillen dan niet identificeren en nauwkeurig AI-gegenereerde tekst onderscheiden van een door mensen geschreven tekst? Het antwoord ligt erin hoe ChatGPT werkt en hoe het tekst genereert.

Hoe ChatGPT tekst genereert

Wanneer je ChatGPT vraagt ​​om tekst te genereren, probeert het het menselijke schrijfproces na te bootsen. Ten eerste is het model achter ChatGPT - Generative Pre-trained Transformer (GPT) - getraind op een groot corpus menselijke tekst. Alles, van e-mails, gezondheidsartikelen, technische artikelen, essays op de middelbare school en zo ongeveer elke tekst die je online kunt vinden, is tijdens de training aan het model ingevoerd. Dus ChatGPT begrijpt hoe elk van dit soort teksten moet worden geschreven.

Als je ChatGPT vraagt ​​om een ​​e-mail naar je baas te schrijven, weet het hoe zo'n e-mail eruit moet zien, omdat het is getraind op vergelijkbare e-mails - waarschijnlijk duizenden. Evenzo, als je het vraagt ​​​​om een ​​essay voor de middelbare school te schrijven, weet het ook hoe een essay voor de middelbare school moet klinken. ChatGPT zal proberen te schrijven wat u maar wilt, zoals een mens dat zou doen.

Maar er zit een addertje onder het gras. In tegenstelling tot hoe mensen schrijven, begrijpt ChatGPT niet echt wat het schrijft op een manier die een mens zou begrijpen. In plaats daarvan probeert de chatbot te voorspellen wat het meest plausibele volgende woord in een zin zou zijn, totdat hij klaar is met schrijven.

Hoe ChatGPT schrijft door voorspelling

Stel dat u ChatGPT vraagt ​​een verhaal te schrijven over een fictieve stad genaamd Volkra. Er is een grote kans dat de chatbot het verhaal begint met de woorden "Er was eens". Dit komt doordat de chatbot niet meedenkt zichzelf, maar probeert te voorspellen wat een mens zou schrijven op basis van wat hij heeft geleerd van de duizenden verhalen die hij tijdens de oorlog heeft gekregen opleiding.

Dus, in de overtuiging dat een mens het verhaal waarschijnlijk zou beginnen met de woorden "Er was eens", zou ChatGPT dan proberen het volgende logische woord te voorspellen, wat zou wees "een" gevolgd door "tijd". Dus je zou dan "Once upon a time..." hebben, gevolgd door het volgende logische woord en het volgende totdat het verhaal is voltooid. ChatGPT schrijft in feite door te voorspellen welk woord van nature (of in ieder geval de grootste kans heeft) om als volgende in een zin te komen en het in te voegen.

Dus wanneer een AI-tool probeert te detecteren of een tekst door AI is gegenereerd, is een van de criteria die het probeert te wegen de voorspelbaarheid van de tekst, aangezien AI-tools schrijven door middel van voorspelling. Deze maatstaf voor voorspelbaarheid wordt perplexiteit genoemd in AI-taalgebruik. Wanneer een AI-tool zoals ChatGPT nu een tekst krijgt aangeboden, probeert deze naast andere criteria de tekst te analyseren om te meten hoe voorspelbaar de volgorde van woorden of zinnen in de tekst is. Grotere voorspelbaarheid of minder verwarring betekent doorgaans dat de tekst waarschijnlijk door AI is gegenereerd. Minder voorspelbaarheid of grotere verbijstering betekent meestal dat de tekst waarschijnlijk door mensen is geschreven.

Deze criteria, samen met andere factoren zoals het niveau van creativiteit van een tekst, zijn helaas niet voldoende om met zekerheid vast te stellen of een tekst is geschreven door een AI-tool of niet. Dit komt omdat mensen met een grotere variantie kunnen schrijven, zoals in de voorbeeldtekst die we aan het begin van dit artikel ter demonstratie hebben gebruikt.

AI-chatbots zoals ChatGPT zijn ontworpen om de natuurlijke menselijke taal zoveel mogelijk na te bootsen. Dus hoewel AI-tekst waarneembare patronen kan hebben, zijn die patronen niet zo duidelijk, zelfs niet voor een krachtige tool als ChatGPT. Dit is de reden waarom ChatGPT zijn eigen schrijven niet kan herkennen, evenals waarom AI-tekstdetectortools niet werken.

Zal ChatGPT zijn eigen schrijven in de toekomst herkennen?

Momenteel kunnen tools zoals ChatGPT niet detecteren of een tekst door hemzelf of een andere AI-tool is geschreven, omdat er geen duidelijk, waarneembaar patroon is in door AI gegenereerde inhoud. De kans is echter groot dat dit binnenkort verandert. Met inspanningen van bedrijven zoals ChatGPT om digitale watermerken te introduceren in door ChatGPT gegenereerde inhoud, zal er een beter waarneembaar patroon zijn in de tekst die door de chatbot wordt gegenereerd.