Er zijn enkele belangrijke verschillen tussen het oudere GPT-3.5-model en het glanzende nieuwe GPT-4-model.
Na alle speculaties en beweringen over de mogelijkheden van GPT-4, werd de langverwachte vierde iteratie van de GPT-taalmodellen gelanceerd op 14 maart 2023.
GPT-4 kwam niet met enkele van de veelgeprezen functies die het volgens geruchten zou hebben. Het nieuwste model is echter aanzienlijk verbeterd ten opzichte van GPT-3.5 en zijn voorgangers. Maar waarin verschilt GPT-4 van GPT-3.5? We nemen enkele belangrijke verschillen met u door tussen GPT-4 en GPT-3.5.
1. GPT-4 vs. GPT-3.5: creativiteit
Een van de meest uitgesproken voordelen van het GPT-4-model ten opzichte van GPT-3.5 is de mogelijkheid om creatievere antwoorden op prompts te geven. Begrijp me niet verkeerd; GPT-3.5 is erg creatief. Er is een lange lijst van creatieve dingen die u kunt doen met ChatGPT dat het model gebruikt. Het presteert echter al beter dan veel grote taalmodellen op het gebied van creativiteit.
GPT-4 legt de lat echter nog hoger. Hoewel het creatieve voordeel van GPT-4 misschien niet duidelijk is bij het oplossen van basisproblemen, is het verschil in creativiteit tussen beide modellen wordt duidelijk naarmate de taak moeilijker wordt en een hoger niveau vereist creativiteit.
Als u beide modellen bijvoorbeeld vraagt om een creatieve taak uit te voeren, zoals het schrijven van een gedicht, waarbij u op elke regel van het gedicht zowel Engels als Frans gebruikt, ChatGPT mogelijk gemaakt door het nieuwste GPT-4-model zal betere resultaten opleveren. Terwijl het antwoord van GPT-4 beide talen op elke regel zou gebruiken, zou GPT-3.5 in plaats daarvan tussen beide talen wisselen, waarbij elke regel de ene taal gebruikt en de volgende de andere.
2. GPT-4 vs. GPT-3.5: beeld- of visuele invoer
Hoewel GPT-3.5 alleen tekstprompts kan accepteren, is GPT-4 multimodaal en kan zowel tekst als visuele invoer worden geaccepteerd. Voor alle duidelijkheid: als we het hebben over visuele invoer, hoeft de afbeelding geen afbeelding van een getypte prompt te zijn - het kan een afbeelding van alles zijn. Dus van een afbeelding van een handgeschreven wiskundig probleem tot Reddit-memes, GPT-4 kan bijna elke afbeelding begrijpen en beschrijven.
In tegenstelling tot GPT-3 is GPT-4 zowel een taal- als een visueel model.
Tijdens de livestream van de GPT-4-aankondiging gaf een OpenAI-engineer het model een screenshot van een Discord-server. GPT-4 zou elk detail erop kunnen beschrijven, inclusief de namen van gebruikers die op dat moment online waren. Een afbeelding van een met de hand getekende mockup van een moppenwebsite werd ook aan het model gegeven met instructies om dit te doen verander het in een website, en verbazingwekkend genoeg leverde GPT-4 een werkende code op voor een website die overeenkwam met de afbeelding.
3. GPT-4 vs. GPT-3.5: Veiliger antwoorden
Hoewel GPT-4 niet perfect is, zijn de maatregelen die het neemt om veiligere reacties te garanderen een welkome upgrade van die van het GPT-3.5-model. Met GPT-3.5 koos OpenAI voor een meer op moderatie gebaseerde benadering van veiligheid. Met andere woorden, sommige veiligheidsmaatregelen waren meer een bijzaak. OpenAI hield bij wat gebruikers deden en de vragen die ze stelden, identificeerde fouten en probeerde ze onderweg op te lossen.
Met GPT-4 zijn de meeste veiligheidsmaatregelen al op modelniveau in het systeem ingebakken. Om het verschil te begrijpen: het is als het bouwen van een huis met robuuste materialen vanaf het begin versus het gebruiken van alles wat maar kan en dan proberen dingen te repareren als er fouten optreden. Volgens OpenAI's GPT-4 technisch rapport [PDF], GPT-4 produceert slechts 0,73% van de tijd toxische reacties vergeleken met de 6,48% toxische reacties van GPT-3.5.
4. GPT-4 vs. GPT-3.5: feitelijkheid van respons
Een van de tekortkomingen van GPT-3.5 is de neiging om zelfverzekerd onzinnige en onware informatie te produceren. In AI-jargon wordt dit "AI-hallucinatie" genoemd en kan het wantrouwen van door AI gegenereerde informatie veroorzaken.
In GPT-4 is hallucinatie nog steeds een probleem. Volgens het technische GPT-4-rapport heeft het nieuwe model echter 19% tot 29% minder kans op hallucinaties in vergelijking met het GPT-3.5-model. Maar dit gaat niet alleen over het technische rapport. Reacties van het GPT-4-model op ChatGPT zijn merkbaar meer feitelijk.
5. GPT-4 vs. GPT-3.5: Contextvenster
Een minder besproken verschil tussen GPT-4 en GPT-3.5 is het contextvenster en de contextgrootte. Een contextvenster is hoeveel gegevens een model in zijn "geheugen" kan bewaren tijdens een chatsessie en voor hoe lang. GPT-4 heeft een aanzienlijk betere contextgrootte en venster dan zijn voorganger.
Concreet betekent dit dat GPT-4 de context van een gesprek langer kan onthouden, evenals de instructies die tijdens het gesprek worden gegeven.
Een probleem met GPT-3.5 is de neiging van het model om off-topic te gaan of instructies niet op te volgen naarmate u vordert in de loop van een gesprek. U kunt bijvoorbeeld tegen het model zeggen dat hij u bij uw naam moet aanspreken, en dat doet hij een tijdje, maar vervolgens volgt hij de instructies niet op. Hoewel dit probleem nog steeds bestaat met het GPT-4-model, is het minder een probleem vanwege een beter contextvenster.
Een ander probleem is de beperking van het tekstvolume dat u in één keer in een prompt kunt gebruiken. Het samenvatten van lange tekst met behulp van GPT-3 betekent meestal dat de tekst in meerdere stukken wordt opgesplitst en deze beetje bij beetje wordt samengevat. De verbetering in contextlengte in het GPT-4-model betekent dat u hele pdf's in één keer kunt plakken en het model kunt laten samenvatten zonder het in stukken te splitsen.
GPT-4: een verbetering ten opzichte van GPT-3.5
Ongetwijfeld is GPT-4 een belangrijke stap voorwaarts ten opzichte van zijn voorgangers. Hoewel het nog steeds wordt geplaagd door enkele beperkingen van GPT-3.5, zijn er aanzienlijke verbeteringen op verschillende gebieden en de toevoeging van nieuwe mogelijkheden maakt het model een opwindende nieuwe stap in het streven naar echt intelligente AI-taal modellen.