Musks langverwachte generatieve AI-tool is er, maar hoe verhoudt deze zich tot andere AI-tools, en wanneer wordt deze gelanceerd?
Belangrijkste leerpunten
- Elon Musk's AI-startup xAI heeft Grok onthuld, een groot taalmodel dat wil concurreren met andere toonaangevende modellen zoals OpenAI's GPT en Anthropic's Claude.
- Grok is ontworpen om vragen met humor en sarcasme te beantwoorden, en laat Musks invloed op de toon en persoonlijkheid zien.
- Hoewel het nog in de bètatestfase zit, suggereren de eerste resultaten dat Grok beter presteert dan andere modellen op het gebied van machine learning-benchmarking, en dat het tweede werd in een test tegen OpenAI's GPT-4.
De strijd om de suprematie van AI woedt voort, nu Elon Musk Grok onthult, het eerste grote taalmodel van zijn jonge AI-startup xAI.
Grok wordt een nieuwe toevoeging aan een drukke generatieve AI-wereld, met als doel te concurreren met marktleidende oppositie OpenAI en zijn GPT-modellen, samen met Claude van Anthropic, Llama 2 van Meta, PaLM 2 van Google en talloze andere LLM's.
Musk heeft xAI's Grok overgehaald, maar heeft het alles wat nodig is om te concurreren?
Wat is de Grok van xAI?
Ondanks dat Musk de wereld er regelmatig aan herinnert dat AI slecht zou kunnen zijn, dat het een wereld zou kunnen creëren zonder banen voor gewone mensen (als je gelooft dat Musks visie hierop goedaardig is, heb ik een brug om je te verkopen) en dat de hele focus van AI meer bestuur nodig heeft, verkondigde Musk trots op X: "In sommige belangrijke aspecten is het [Grok] de beste die de huidige bestaat."
Grok-1 is dus een groot taalmodel vergelijkbaar met OpenAI's GPT-3.5 en GPT-4. De generatieve AI-chatbot van xAI lijkt momenteel ook Grok te heten (vergelijkbaar met hoe het Claude-model van Anthropic ook hetzelfde is als zijn AI-tool).
Maar hoewel Grok vragen op een gemoedelijke manier zal beantwoorden, lijkt Musk enige invloed te hebben gehad op de toon van Grok. xAI's officiële Grok-aankondiging met vermelding van:
Grok is ontworpen om vragen met een beetje humor te beantwoorden en heeft een rebelse inslag, dus gebruik het alsjeblieft niet als je een hekel hebt aan humor!
Of, zoals Musk zelf zei: Grok ‘is gebaseerd en houdt van sarcasme. Ik heb geen idee wie dit op deze manier heeft kunnen begeleiden."
Voor elke toevallige waarnemer is Musks grinniken over zijn basis allesbehalve: hij belandt meer op het teenkrullende vlak van ongemak, wat een diepgeworteld gevoel van schaamte oplevert. Maar voor Musk's legioen fans is xAI's Grok het langverwachte 'antwoord op het gedrocht van WokeGPT', een verwijzing naar de grenzen en waargenomen neutralisering van de mogelijkheden van ChatGPT door OpenAI.
Hoe presteert Grok? Is Grok beter dan ChatGPT?
Aangezien tot nu toe slechts een klein aantal gebruikers toegang heeft gekregen tot Grok, komt het meeste van wat we weten over de prestaties ervan van xAI. Het bedrijf wilde benadrukken dat "Grok nog steeds een zeer vroeg bètaproduct is" en dat de huidige prestaties "het beste zijn wat we konden doen met twee maanden training."
Toch lijkt Grok op de goede weg te zijn. Volgens het onderzoek van xAI werd het prototype Grok-0-model getraind met behulp van 33 miljard parameters presteerde beter dan het Llama 2 70 miljard parametermodel in gestandaardiseerde machine learning benchmarking en testen. Na enkele aanpassingen (en vermoedelijk een uitgebreide set parameters) presteerde Grok-1 beter dan OpenAI's GPT-3.5 (ongeveer 175 miljard parameters).
Maar als extra zegen voor Musk en Grok, tijdens een laatste testronde voor de Hongaarse Nationale Middelbare School-eindexamens in Wiskunde van 2023 (ja, onduidelijk, maar met opzet om de kans te vermijden dat de gegevens zijn geüpload naar een bestaande LLM, wat deze een voordeel zou opleveren), kwam Grok alleen op de tweede plaats na OpenAI's GPT-4.
Musk heeft ook opgemerkt dat de directe internettoegang van Grok hem een voordeel zal opleveren ten opzichte van andere generatieve AI-tools die geen toegang hebben.
Momenteel is het moeilijk te zeggen of Grok beter is dan ChatGPT, en het is duidelijk dat Grok vooruitgang boekt op basis van het werk dat al door andere AI-onderzoeksbedrijven is verricht.
Hoeveel gaat Grok kosten? Wie kan Grok gebruiken?
Grok bevindt zich momenteel nog in de vroege testfase. Er is beperkte bètatoegang verleend aan een klein aantal X Premium Plus-gebruikers, die momenteel $ 16 per maand kost. Zodra Grok de bètaperiode verlaat, wordt het beschikbaar voor alle X Premium Plus-abonnees, waarbij een zware AI-vormige wortel boven X-verificatie bungelt.
Het is momenteel niet bekend of Grok met een gratis toegangslaag komt, die alle andere grote generatieve AI-tools bieden. OpenAI houdt bijvoorbeeld zijn minder krachtige ChatGPT-3.5-model gratis, terwijl Anthropic een gratis versie van Claude aanbiedt. Het beperken van Grok tot de geverifieerde betalende klanten van X zal waarschijnlijk niet de rekening betalen, vooral gezien de daling van het aantal gebruikers van X sinds de overname van Musk.
Ik zou verwachten dat xAI een eerdere versie van Grok gratis zou uitbrengen, of op zijn minst veel goedkoper, in de hoop dat het gebruikers aanmoedigt om naar de volledige versie te upgraden. Een ander probleem dat de acceptatie van Grok in de weg kan staan, is de huidige directe link met X Premium Plus. Er kunnen gebruikers zijn die zich willen abonneren op Grok, maar geen X-verificatie of een van Musk's betaalde Blue Ticks naast hun naam willen hebben - iets anders waar Musk, X en xAI mee worstelen.
Musk heeft aangegeven dat er in de toekomst mogelijk een aparte versie van Grok zal verschijnen, maar daar is op dit moment weinig informatie over.
Wat is de toekomst voor xAI's Grok?
xAI's ontwikkeling van Grok betekent een ander doel voor Musk, die ooit deel uitmaakte van het OpenAI-team. Hij verzet zich al lange tijd tegen de waargenomen censuur van ChatGPT door OpenAI, met het argument dat het beperken van de mogelijkheden ervan een beperking inhoudt van wat mensen kunnen en zouden moeten kunnen doen met zulke krachtige AI-tools.
Wat er daarna komt voor Grok is nog onbekend. Hoewel het duidelijk is dat er een aantal beperkingen in Grok zijn ingebouwd, zal de echte test voor de grenzen ervan pas duidelijk worden zodra het publiek het in handen krijgt.