Grote taalmodellen (LLM's) zijn er in alle soorten en maten en helpen u op elke gewenste manier. Maar wat is het beste? We hebben de dominante AI's van Alphabet, OpenAI en Meta op de proef gesteld.

Wat u moet weten over AI-chatbots

Kunstmatige algemene intelligentie is al tientallen jaren een doel van computerwetenschappers en AI is nog langer een steunpilaar geweest voor sciencefictionschrijvers en filmmakers.

AGI vertoont intelligentie vergelijkbaar met menselijke cognitieve vermogens, en de Turing-test- een test van het vermogen van een machine om intelligent gedrag te vertonen dat niet te onderscheiden is van dat van een mens - bleef bijna onbetwist in de zeven decennia sinds het voor het eerst werd ontworpen.

De recente convergentie van extreem grootschalige computers, enorme hoeveelheden geld en de verbazingwekkende hoeveelheid vrij beschikbare informatie beschikbaar op het open internet stelde techreuzen in staat om modellen te trainen die het volgende woordgedeelte - of token - kunnen voorspellen in een reeks van Munten.

instagram viewer

Op het moment van schrijven allebei De bard van Google En ChatGPT van OpenAI zijn voor u beschikbaar om te gebruiken en te testen via hun webinterfaces.

Het taalmodel van Meta, LLaMa, is niet beschikbaar op het web, maar u kunt het wel gemakkelijk download en voer LLaMa uit op uw eigen hardware en gebruik het via een opdrachtregel of voer Dalai uit op uw eigen machine—een van de vele apps met een gebruiksvriendelijke interface.

Voor de test gebruiken we het Alpaca 7B-model van Stanford University - een aanpassing van LLaMa - en zetten we het op tegen Bard en ChatGPT.

De volgende vergelijkingen en tests zijn niet bedoeld om uitputtend te zijn, maar geven u eerder een indicatie van de belangrijkste punten en mogelijkheden.

Wat is het gemakkelijkste grote taalmodel om te gebruiken?

Zowel Bard als ChatGPT hebben een account nodig om de service te gebruiken. Zowel Google- als OpenAI-accounts zijn eenvoudig en gratis aan te maken en je kunt meteen beginnen met het stellen van vragen.

Om LLaMa lokaal uit te voeren, moet u enige gespecialiseerde kennis hebben of een tutorial kunnen volgen. Je hebt ook een aanzienlijke hoeveelheid opslagruimte nodig.

Wat is het meest private grote taalmodel?

Zowel Bard als ChatGPT hebben een uitgebreid privacybeleid, en Google benadrukt herhaaldelijk in zijn documenten dat u "geen informatie moet opnemen die kan worden gebruikt om u of anderen in uw Bard te identificeren gesprekken."

Google verzamelt standaard uw gesprekken en uw algemene locatie op basis van uw IP-adres, uw feedback en gebruiksinformatie. Deze informatie wordt maximaal 18 maanden in uw Google-account bewaard. Hoewel u het opslaan van uw Bard-activiteit kunt onderbreken, moet u zich ervan bewust zijn dat "om te helpen met de kwaliteit en het verbeteren van onze producten, menselijke recensenten uw Bard-gesprekken lezen, annoteren en verwerken."

Ook het gebruik van Bard valt onder de norm Google-privacybeleid.

Het privacybeleid van OpenAI is in grote lijnen vergelijkbaar en verzamelt IP-adres- en gebruiksgegevens. In tegenstelling tot de in de tijd beperkte bewaring van Google, zal OpenAI "uw persoonlijke informatie slechts zo lang bewaren als nodig is om onze Service aan u, of voor andere legitieme zakelijke doeleinden zoals het oplossen van geschillen, veiligheids- en beveiligingsredenen, of het voldoen aan onze wettelijke verplichtingen."

Voor een lokaal model op uw eigen computer is daarentegen geen account vereist en hoeft u met niemand gebruikersgegevens te delen.

Welke LLM heeft de beste algemene kennis?

Om te testen welke LLM de beste algemene kennis heeft, hebben we drie vragen gesteld.

De eerste vraag: "Welke nationale vlag heeft vijf zijden?" werd alleen correct beantwoord door Bard, die identificeerde dat de nationale vlag van Nepal vijf zijden heeft.

ChatGPT beweerde zelfverzekerd: "Er is geen nationale vlag met vijf zijden. Nationale vlaggen zijn typisch rechthoekig of vierkant van vorm, gekenmerkt door hun verschillende kleuren, patronen en symbolen".

Ons lokale model kwam in de buurt en stelde dat "De Indiase nationale vlag vijf zijden heeft en in 1916 is ontworpen om India's onafhankelijkheidsbeweging." Hoewel deze vlag bestond en vijf zijden had, was het de vlag van de Indiase Home Rule Movement - geen nationale vlag.

Geen van onze modellen kon antwoorden dat de juiste term voor een erwtvormig object 'pisiform' is, terwijl ChatGPT gaat zover dat suggereert dat erwten een "driedimensionale geometrische vorm hebben die perfect rond en symmetrisch."

Alle drie de chatbots identificeerden Franco Malerba correct als een Italiaanse astronaut en lid van de Europees Parlement, waarbij Bard een antwoord geeft dat identiek is geformuleerd aan een gedeelte van Malerba's Wikipedia binnenkomst.

Welke LLM is goed voor technische instructies?

Als je technische problemen hebt, kom je misschien in de verleiding om een ​​chatbot in te schakelen voor hulp. Terwijl de technologie voortschrijdt, blijven sommige dingen hetzelfde. De BS 1363-stekker wordt sinds 1947 gebruikt in Groot-Brittannië, Ierland en vele andere landen. We vroegen de taalmodellen hoe ze het correct moesten aansluiten.

Kabels die aan de stekker zijn bevestigd, hebben een draad onder spanning (bruin), een aardedraad (geel/groen) en een nuldraad (blauw). Deze moeten op de juiste klemmen in de stekkerbehuizing worden aangesloten.

Onze Dalai-implementatie identificeerde de stekker correct als "Engelse stijl", zwenkte toen van koers en gaf in plaats daarvan instructies voor de oudere BS 546-stekker met ronde pin samen met oudere bedradingskleuren.

ChatGPT was iets nuttiger. Het labelde de bedradingskleuren correct en gaf een materiaallijst en een set van acht instructies. ChatGPT stelde ook voor om de bruine draad in de terminal met het label "L" te steken, en de blauwe draad in de "N" terminal, en de gele draad in "E." Dit zou correct zijn als BS1363-terminals waren gelabeld, maar ze zijn niet.

Bard identificeerde de juiste kleuren voor de draden en instrueerde ons om ze aan te sluiten op Live, Neutral en Earth-terminals. Het gaf geen instructies over hoe deze te identificeren.

Naar onze mening. geen van de chatbots gaf voldoende instructies om iemand te helpen een BS 1363-stekker correct aan te sluiten. Een beknopt en correct antwoord zou zijn: "Blauw aan de linkerkant, bruin aan de rechterkant."

Welke LLM is goed voor het schrijven van code?

Python is een handige programmeertaal die op de meeste moderne platformen draait. We hebben onze modellen geïnstrueerd om Python te gebruiken en "Bouw een basisrekenprogramma dat rekenkundige bewerkingen kan uitvoeren, zoals optellen, aftrekken, vermenigvuldigen en delen. Er moet gebruikersinvoer nodig zijn en het resultaat weergeven." Dit is een van de beste programmeerprojecten voor beginners.

Hoewel zowel Bard als ChatGPT onmiddellijk bruikbare en grondig becommentarieerde code retourneerden, die we konden testen en verifiëren, werkte geen van de code van ons lokale model.

Welke LLM vertelt de beste grappen?

Humor is een van de fundamenten van het mens-zijn en zeker een van de beste manieren om mens en machine uit elkaar te houden. Aan elk van onze modellen gaven we de simpele opdracht: "Maak een originele en grappige grap."

Gelukkig voor komieken overal en voor de mensheid in het algemeen, was geen van de modellen in staat om een ​​originele grap te maken.

Bard rolde de klassieker uit: "Waarom heeft de vogelverschrikker een prijs gewonnen? Hij was uitstekend in zijn vakgebied".

Zowel onze lokale implementatie als ChatGPT boden de kreunwaardige: "Waarom vertrouwen wetenschappers atomen niet? Omdat ze alles verzinnen!"

Een afgeleide maar originele grap zou zijn: "Hoe zijn grote taalmodellen zoals atomen? Ze verzinnen het allebei!"

Je leest het hier eerst, mensen.

Geen enkele chatbot is perfect

We ontdekten dat hoewel alle drie de grote taalmodellen hun voor- en nadelen hebben, geen van hen de echte expertise van een mens kan vervangen door gespecialiseerde kennis.

Hoewel zowel Bard als ChatGPT betere antwoorden gaven op onze codeervraag en zeer gebruiksvriendelijk zijn, lokaal een groot taalmodel draaien betekent dat u zich geen zorgen hoeft te maken over privacy of censuur.

Als je geweldige AI-kunst wilt maken zonder je zorgen te hoeven maken dat iemand over je schouder meekijkt, kun je ook eenvoudig een kunst-AI-model op je lokale computer uitvoeren.