Bard vs. ChatGPT vs. Offline Alpaca: Koji je najbolji LLM?

Veliki jezični modeli (LLM) dolaze u svim oblicima i veličinama i pomoći će vam na bilo koji način koji smatrate prikladnim. Ali koji je najbolji? Stavili smo na test dominantne umjetne inteligencije Alphabet, OpenAI i Meta.

Što trebate znati o AI Chatbotovima

Umjetna opća inteligencija bila je cilj računalnih znanstvenika desetljećima, a AI je još dulje služila kao oslonac piscima znanstvene fantastike i filmskim stvarateljima.

AGI pokazuje inteligenciju sličnu ljudskim kognitivnim sposobnostima, i Turingov test— test sposobnosti stroja da pokaže inteligentno ponašanje koje se ne može razlikovati od ljudskog — ostao je gotovo neosporen u sedam desetljeća otkako je prvi put postavljen.

Nedavna konvergencija iznimno velikog računalstva, ogromne količine novca i zapanjujuća količina informacija slobodno dostupan na otvorenom internetu omogućio je tehnološkim divovima treniranje modela koji mogu predvidjeti sljedeći odjeljak riječi—ili token—u nizu žetoni.

U vrijeme pisanja, oboje Googleov Bard i OpenAI-jev ChatGPT dostupni su za korištenje i testiranje putem njihovih web sučelja.

instagram viewer

Metin jezični model, LLaMa, nije dostupan na webu, ali možete lako preuzmite i pokrenite LLaMa na vlastitom hardveru i koristiti ga putem naredbenog retka ili pokrenuti Dalai na vlastitom stroju— jedna od nekoliko aplikacija sa korisnički prilagođenim sučeljem.

Za potrebe testa, pokrenut ćemo model Alpaca 7B Sveučilišta Stanford—prilagodbu LLaMa—i usporediti ga s Bardom i ChatGPT-om.

Sljedeće usporedbe i testovi ne trebaju biti iscrpni, već vam daju naznaku ključnih točaka i mogućnosti.

Koji je model velikog jezika najlakši za korištenje?

I Bard i ChatGPT zahtijevaju račun za korištenje usluge. I Google i OpenAI račune lako je i besplatno izraditi, a možete odmah početi postavljati pitanja.

Međutim, da biste pokrenuli LLaMa lokalno, morat ćete imati neko specijalizirano znanje ili sposobnost praćenja vodiča. Trebat će vam i značajna količina prostora za pohranu.

Koji je najprivatniji model velikog jezika?

I Bard i ChatGPT imaju opsežna pravila o privatnosti, a Google opetovano naglašava u svojim dokumentima da ne biste trebali uključivati informacije koje se mogu koristiti za identifikaciju vas ili drugih u vašem Bardu razgovori."

Prema zadanim postavkama, Google prikuplja vaše razgovore i vašu opću lokaciju na temelju vaše IP adrese, vaših povratnih informacija i podataka o korištenju. Ovi se podaci pohranjuju na vašem Google računu do 18 mjeseci. Iako možete pauzirati spremanje svoje Bard aktivnosti, trebali biste biti svjesni da "kako bismo pomogli u kvaliteti i poboljšanju naših proizvoda, recenzenti čitaju, komentiraju i obrađuju vaše Bard razgovore."

Korištenje Barda također podliježe standardu Google Pravila o privatnosti.

Politika privatnosti OpenAI-ja je uglavnom slična i prikuplja podatke o IP adresi i korištenju. Za razliku od Googleovog vremenski ograničenog zadržavanja, OpenAI će "zadržati vaše osobne podatke samo onoliko dugo koliko nam je potrebno kako bismo pružili Usluga za vas ili za druge legitimne poslovne svrhe kao što su rješavanje sporova, sigurnosnih i sigurnosnih razloga ili usklađivanje s našim pravnim obveze."

Nasuprot tome, lokalni model na vašem vlastitom računalu ne zahtijeva račun niti dijeljenje korisničkih podataka s bilo kim.

Koji LLM ima najbolje opće znanje?

Kako bismo testirali koji LLM ima najbolje opće znanje, postavili smo tri pitanja.

Prvo pitanje, "Koja državna zastava ima pet strana?" je jedino točno odgovorio Bard, koji je identificirao nacionalnu zastavu Nepala kao peterostranu.

ChatGPT je samouvjereno tvrdio da "Ne postoji državna zastava koja ima pet strana. Nacionalne zastave obično su pravokutnog ili kvadratnog oblika, a karakteriziraju ih različite boje, šare i simboli".

Naš lokalni model bio je blizu, rekavši da "Indijska državna zastava ima pet strana i dizajnirana je 1916. da predstavlja Indiju pokreta za neovisnost." Iako je ova zastava postojala i imala je pet strana, bila je to zastava indijskog pokreta samouprave - a ne nacionalna zastava.

Nijedan od naših modela nije mogao odgovoriti da je ispravan izraz za objekt u obliku graška "pisiform", s ChatGPT-om toliko da sugerira da grašak ima "trodimenzionalni geometrijski oblik koji je savršeno okrugao i simetričan."

Sva tri chatbota ispravno su identificirala Franca Malerbu kao talijanskog astronauta i člana Europskog parlamenta, a Bard je dao odgovor identičan dijelu Malerbine Wikipedije unos.

Koji je LLM dobar za tehničke upute?

Kada imate tehničkih problema, mogli biste doći u iskušenje da se za pomoć obratite chatbotu. Dok tehnologija napreduje, neke stvari ostaju iste. Električni utikač BS 1363 u upotrebi je u Britaniji, Irskoj i mnogim drugim zemljama od 1947. Pitali smo jezične modele kako to ispravno spojiti.

Kabeli koji se spajaju na utikač imaju žicu pod naponom (smeđa), žicu za uzemljenje (žuta/zelena) i neutralnu žicu (plava). Oni moraju biti pričvršćeni na ispravne priključke unutar kućišta utikača.

Naša Dalai implementacija ispravno je identificirala utikač kao "engleski stil", zatim je skrenula s kursa i umjesto toga dala upute za stariji okrugli BS 546 utikač zajedno sa starijim bojama ožičenja.

ChatGPT je bio malo korisniji. Ispravno je označio boje ožičenja i dao popis materijala i set od osam uputa. ChatGPT je također predložio stavljanje smeđe žice u terminal s oznakom "L", plave žice u "N" terminal, a žutu žicu u "E." To bi bilo točno da su terminali BS1363 označeni, ali oni nisu.

Bard je identificirao ispravne boje za žice i uputio nas da ih spojimo na priključke pod naponom, neutralni i uzemljeni. Nije dao upute o tome kako ih identificirati.

Po našem mišljenju. niti jedan chatbot nije dao dovoljne upute da nekome pomogne ispravno spojiti električni utikač BS 1363. Koncizan i točan odgovor bio bi: "Plava s lijeve strane, smeđa s desne strane."

Koji je LLM dobar za pisanje koda?

Python je koristan programski jezik koji radi na većini modernih platformi. Uputili smo naše modele da koriste Python i "izgrade osnovni program kalkulatora koji može izvoditi aritmetičke operacije poput zbrajanja, oduzimanja, množenja i dijeljenja. Treba uzeti korisnički unos i prikazati rezultat." Ovo je jedan od najbolji programski projekti za početnike.

Dok su i Bard i ChatGPT odmah vratili upotrebljiv i temeljito komentiran kod, koji smo mogli testirati i potvrditi, nijedan kod iz našeg lokalnog modela nije se mogao pokrenuti.

Koji LLM priča najbolje viceve?

Humor je jedan od temelja ljudskog bića i zasigurno jedan od najboljih načina razlikovanja čovjeka od stroja. Svakom našem modelu dali smo jednostavan upit: "Stvorite originalnu i smiješnu šalu."

Srećom za komičare posvuda i ljudsku rasu u cjelini, nijedan od modela nije bio sposoban generirati originalnu šalu.

Bard je izbacio klasik: "Zašto je strašilo osvojilo nagradu? Bio je izvanredan u svom polju."

I naša lokalna implementacija i ChatGPT ponudili su uzdaha vrijedno: "Zašto znanstvenici ne vjeruju atomima? Jer oni sve izmišljaju!"

Izvedena, ali originalna šala bila bi: "Kako su veliki jezični modeli poput atoma? Obojica izmišljaju stvari!"

Prvo pročitajte ovdje, ljudi.

Nijedan chatbot nije savršen

Otkrili smo da, iako sva tri velika jezična modela imaju svoje prednosti i nedostatke, nijedan od njih ne može zamijeniti stvarnu stručnost ljudskog bića specijaliziranim znanjem.

Iako su i Bard i ChatGPT dali bolje odgovore na naše pitanje kodiranja i vrlo su jednostavni za korištenje, pokretanje velikog jezičnog modela lokalno znači da ne morate brinuti o privatnosti ili cenzura.

Ako želite stvarati sjajnu AI umjetnost bez brige da vas netko gleda preko ramena, lako je pokrenuti umjetnički AI model i na vašem lokalnom računalu.

About Technology - denizatm.com

Bard vs. ChatGPT vs. Offline Alpaca: Koji je najbolji LLM?

Što trebate znati o AI Chatbotovima

Koji je model velikog jezika najlakši za korištenje?

Koji je najprivatniji model velikog jezika?

Koji LLM ima najbolje opće znanje?

Koji je LLM dobar za tehničke upute?

Koji je LLM dobar za pisanje koda?

Koji LLM priča najbolje viceve?

Nijedan chatbot nije savršen

Kategorije

Recent Post

Samsung 65" QN90B: Premium 4K 120Hz TV koji s lakoćom upravlja svijetlim sobama

Kako ručno ažurirati Microsoft Defender

Koji je najbolji besplatni VPN za macOS?