Hoewel ChatGPT een van de populairste AI-chatbots is, is het misschien niet langer de beste. Claude AI biedt een aantal GPT-beating-functies. Maar wat is beter?
Sinds de release in november 2022 is ChatGPT de dominante kracht in de AI-chatbotruimte gebleven. Ondanks verreikende inspanningen van verschillende AI-bedrijven is niemand er echt in geslaagd een chatbot te bouwen die ChatGPT echt uitdaagt wat betreft de algehele responskwaliteit. Google's bard? Microsoft's Bing-AI? Nee niet echt.
Claude AI, een chatbot gebouwd door AI-startup Anthropic, toont echter kwaliteiten van een chatbot die ChatGPT kan onttronen. Een aanzienlijk aantal gebruikers zegt al dat Claude de betere optie is. Maar is dit het geval? Laten we beide chatbots eens uitproberen.
ChatGPT vs. Claude AI: gezond verstand en logisch redeneren
Er is een intrigerend contrast bij het werken met AI-chatbots. Aan de ene kant kunnen ze door complexe taken heen zoeven waar mensen dagenlang aan moeten werken om ze op te lossen. Aan de andere kant worstelen ze soms met elementaire problemen die slechts een beetje gezond verstand of logisch redeneren vereisen. Daarom hebben we zowel ChatGPT als Claude AI getest om te zien welke AI-chatbot beter was in taken met gezond verstand en logisch redeneren.
ChatGPT heeft het probleem in stukjes opgedeeld en bij de eerste poging opgelost. Claude AI probeerde het ook en loste het probleem ook op, maar met een andere aanpak.
Voor de eerste taak wisten beide chatbots het probleem te kraken. Dus gingen we verder met een ander soort probleem. We hebben beide chatbots de opdracht gegeven een strikvraag te beantwoorden.
ChatGPT kon de truc meteen doorzien: je kunt overlevenden niet begraven omdat ze niet dood zijn. Claude AI daarentegen leek te begrijpen dat het een strikvraag was, maar slaagde er niet in het meest logische probleem te ontdekken dat je overlevenden niet begraaft.
In plaats daarvan analyseerde het de vraag te veel en kwam tot de conclusie dat er "geen overlevenden zouden zijn om te begraven", omdat een crash van Mars naar de aarde fataal zou zijn. Het is niet het antwoord dat we hadden verwacht, maar als je de zaken vanuit een andere hoek bekijkt, zit er een kern van waarheid in.
Voor deze taak geven we het aan ChatGPT, maar we kunnen de aanpak van Claude AI niet volledig uitsluiten. Voor onze laatste taak op dit gebied vroegen we beide chatbots hoeveel appels er daarna nog aan een appelboom zouden zitten respectievelijk vijf en tien dagen als we begonnen met tien appels en vijf daarvan werden in plakjes gesneden terwijl ze nog aan de boom zaten. ChatGPT zei dat er nog 10 appels over zouden zijn.
Claude AI daarentegen gaf een meer gezond verstand antwoord door te erkennen dat de vijf in plakjes gesneden appels waarschijnlijk zullen gaan rotten.
Claude AI heeft deze duidelijk begrepen. We hebben nog een paar lastige problemen geprobeerd, en beide chatbots hadden een behoorlijk aantal successen en mislukkingen bij het omgaan ermee. Gezien de uitkomst die we hebben waargenomen, kan het eerlijk zijn om te zeggen dat hoewel ChatGPT een voorsprong heeft, beide chatbots niet te ver uit elkaar liggen wat betreft gezond verstand en logisch redeneervermogen.
ChatGPT vs. Claude AI: wiskundige vaardigheden
Zelfs als je nooit van plan bent ChatGPT of Claude AI te gebruiken om je Algebra-huiswerk op te lossen, hebben hun wiskundige vaardigheden verstrekkende gevolgen. Voor AI-chatbots is wiskunde de sleutel tot het begrijpen van de logica in de echte wereld, het identificeren van gebrekkig denken en het toegeven van fouten.
In wezen is wiskundevaardigheid een kernmaatstaf van kunstmatige intelligentie. Dus, tussen ChatGPT en Claude AI, welke chatbot is beter in wiskunde? We hebben beide chatbots de opdracht gegeven een kronkelig wiskundig productiviteitsprobleem op te lossen. We zijn begonnen met Claude AI en de chatbot loste het probleem op.
ChatGPT heeft het probleem ook opgelost.
Verderop vroegen we beide chatbots om dit op te lossen 8/a-1 = 20/3a-1, een redelijk eenvoudig wiskundig probleem met een verrassend hoog percentage mislukkingen onder AI-chatbots. ChatGPT heeft het kunnen oplossen en een correct antwoord gegeven -3 bij de eerste poging.
Claude AI faalde bij de eerste poging, maar toen we hem aanspoorden het probleem stap voor stap op te lossen (wat hem dwingt om elke stap van zijn logica te overdenken), kon hij het kraken.
We hebben nog een paar wiskundeproblemen geprobeerd. Hoewel beide chatbots het in sommige gevallen bij de eerste poging meteen goed hadden, had Claude AI in verschillende gevallen een tweede of derde poging nodig om het juiste antwoord te geven. Op het gebied van wiskundige vaardigheden geven we de kroon aan ChatGPT.
ChatGPT vs. Claude AI: Creativiteit
Een van de grootste hypes van Claude AI zijn de creatieve capaciteiten. Maar kan het de creativiteit van ChatGPT evenaren? Of zou het ChatGPT mogelijk kunnen overtreffen? Om beide chatbots op de proef te stellen, hebben we ze de opdracht gegeven om teksten te schrijven voor een rapnummer dat rijmt.
We hebben gekozen voor een rijmende raptest, omdat daar veel taalmodellen moeite mee hebben. De meeste modellen zullen het rijm doorgaans niet goed hebben of het rijm niet goed, terwijl de tekst zelf niet klopt. Om het nog interessanter te maken, gaat het rapnummer over het kweken van komkommers.
Dus vroegen we zowel ChatGPT als Claude AI om "een rijmende rap te schrijven over het kweken van komkommers als boer en er miljonair van worden." ChatGPT ging als eerste, en zoals verwacht leverde het wat spannends op teksten.
Vervolgens hebben we dezelfde prompt aan Claude AI doorgegeven, en die gaf hem ook een eerlijke kans.
Beide teksten zijn goed, maar ChatGPT leek hier een voorsprong te hebben. Het rijmde beter en we hadden bij de eerste proef het resultaat dat we nodig hadden. We moesten het drie keer proberen voordat Claude AI rijmende teksten kon produceren. Deze geven we aan ChatGPT.
Nadat hij nog een paar creatieve taken had uitgeprobeerd, leek Claude AI uit te blinken in schrijfgerelateerde taken en kon hij natuurlijker klinkende inhoud schrijven, zoals een menselijke schrijver zou doen. Hoewel ChatGPT was beter in het overwinnen van complexere creatieve taken, kon het soms het AI-chatbot-gevoel in de tekst die het genereerde niet van zich afschudden. Ons oordeel? Zowel ChatGPT als Claude AI zijn op zichzelf creatief.
ChatGPT vs. Claude AI: Codeervaardigheden
Net als wiskundige vaardigheden zijn codeervaardigheden een andere zeer belangrijke maatstaf voor het beoordelen van de capaciteiten van een AI-chatbot. Terwijl de meerderheid van de gebruikers dat waarschijnlijk nooit zal doen gebruik een chatbot voor het coderen, zijn er aanzienlijke onderliggende implicaties voor het vermogen van een chatbot om code vaardig te schrijven en te begrijpen.
Hoewel chatbots momenteel geavanceerd zijn, zijn ze nog lang niet wat ze daadwerkelijk zouden kunnen worden als en wanneer ze vaardig code kunnen schrijven. Om AI-chatbots echt te laten evolueren naar krachtige AI-assistenten die meer kunnen dan alleen tekst genereren, moeten ze code kunnen schrijven die problemen op aanvraag oplost. We hebben eerder besproken hoe belangrijk codeervaardigheden zijn voor AI-chatbots in onze ChatGPT Code Interpreter-uitleg.
Dat gezegd hebbende, hebben we beide chatbots op twee codeertaken gezet. We vroegen ChatGPT en Claude AI om functionele code te schrijven voor een to-dolijst-app. Beginnend met ChatGPT kon de AI-chatbot bij de eerste poging een functionele takenlijst-app leveren. We hebben het gekopieerd en geplakt in een browser, en het werkte perfect zonder fouten. Hier is de uitvoer in een browser.
Vervolgens ging de chatbot verder met Claude AI en schreef duidelijk begrijpelijke code. De structuur en logica leken allemaal prima. Helaas miste Claude AI, ondanks herhaalde pogingen, steeds een aantal kritische logica om de code daadwerkelijk in een browser te laten draaien. Het is een mislukking op dit punt.
Nadat Claude AI de laatste test niet had doorstaan, probeerden we een ander soort codeertaak, een taak die meer ging over het analyseren van code en minder over het schrijven van nieuwe code. We hebben vijf PHP-bestanden geüpload die de volledige backend voor een website vertegenwoordigen en hebben zowel Claude AI als ChatGPT gevraagd waar we alle geüploade bestanden moeten bewerken om ervoor te zorgen dat we een e-mail ontvangen zodra een nieuwe gebruiker zich registreert op de plaats.
Verrassend genoeg faalde ChatGPT, ondanks schijnbaar superieure codeervaardigheden, hierin ondanks herhaalde pogingen. Claude AI daarentegen was in staat de code vakkundig te analyseren en tegelijkertijd de juiste plaatsen te identificeren die moesten worden bewerkt om de gewenste resultaten te bereiken.
Dit was natuurlijk geen op zichzelf staand geval; we herhaalden het met verschillende andere codebestanden, maar ChatGPT struikelde en liep vast in de meeste gevallen, terwijl Claude AI indrukwekkende resultaten bleef leveren. Wat codeervaardigheden betreft, is de winnaar niet helemaal eenduidig.
ChatGPT is duidelijk aanzienlijk beter in het schrijven van nieuwe code en kan complexe code met indrukwekkende vaardigheid beheren. Claude AI is echter aanzienlijk beter in het analyseren van grote codebases. Dus als u code wilt schrijven voor een nieuw idee dat u heeft, is ChatGPT de tool waar u terecht kunt. Als je een codebasis met duizenden regels over verschillende bestanden wilt analyseren of begrijpen, dan zouden we Claude AI zeker aanbevelen.
Claude AI is een krachtige concurrent in de buurt
Claude AI vertegenwoordigt een krachtige concurrentie voor ChatGPT - een die ooit kan concurreren met ChatGPT en deze mogelijk kan overtreffen. Aangezien Claude een relatief nieuw AI-model is, is het benijdenswaardig dat het ChatGPT kan gebruiken zoals het momenteel doet. De opkomst van Claude AI en de kwaliteit die het biedt, bewijzen dat de concurrentie toeneemt.