Vjerojatno ste čuli za OpenAI GPT, ali oni nisu jedini LLM-ovi u bloku.

Ključni zahvati

  • OpenAI-jev GPT-4 je najnapredniji i naširoko korišten veliki jezični model, s 1,76 trilijuna parametara i multimodalnim mogućnostima.
  • Anthropicov Claude 2 natječe se s GPT-4 u zadacima kreativnog pisanja i drži se unatoč tome što ima manje resursa.
  • Googleov PaLM 2, iako nije ubojica GPT-4, moćan je jezični model sa snažnim višejezičnim i kreativnim sposobnostima. Falcon-180B je model otvorenog koda koji konkurira komercijalnim gigantima i može se nositi s GPT-3.5.

Sezona je umjetne inteligencije i tehnološke tvrtke izbacuju velike jezične modele poput kruha iz pekare. Novi modeli izlaze brzo i postaje ih preteško pratiti.

Ali usred naleta novih izdanja, samo se nekoliko modela popelo do vrha i dokazalo se kao pravi konkurenti u velikom prostoru jezičnih modela. Kako se približavamo kraju 2023., sastavili smo šest najimpresivnijih modela velikih jezika koje biste trebali isprobati.

1. OpenAI-jev GPT-4

instagram viewer

GPT-4 je najnapredniji javno dostupan veliki jezični model do sada. Razvio OpenAI i objavljen u ožujku 2023. GPT-4 je najnovija iteracija u seriji Generative Pre-trained Transformer koja je započela 2018. Sa svojim ogromnim mogućnostima, GPT-4 je postao jedan od najčešće korištenih i najpopularnijih modela velikih jezika na svijetu.

Iako nije službeno potvrđeno, izvori procjenjuju da bi GPT-4 mogao sadržavati nevjerojatnih 1,76 bilijuna parametara, oko deset puta veći od svog prethodnika, GPT-3.5, i pet puta veći od Googleovog vodećeg modela, PaLM 2. Ova ogromna skala omogućuje GPT-4 multimodalne sposobnosti, dopuštajući mu da obrađuje i tekst i slike kao ulaz. Kao rezultat toga, GPT-4 može interpretirati i opisati vizualne informacije poput dijagrama i snimaka zaslona uz tekst. Njegova multimodalna priroda omogućuje razumijevanje podataka iz stvarnog svijeta više nalik ljudskom.

U znanstvenim mjerilima, GPT-4 značajno nadmašuje ostale suvremene modele u raznim testovima. Iako same referentne vrijednosti ne pokazuju u potpunosti snagu modela, slučajevi korištenja u stvarnom svijetu pokazali su da je GPT-4 iznimno vješt u intuitivnom rješavanju praktičnih problema. GPT-4 trenutno se naplaćuje 20 USD mjesečno i dostupan putem ChatGPT-ovog Plus plana.

2. Anthropicov Claude 2

Kredit za sliku: antropski

Iako nije toliko popularan kao GPT-4, Claude 2, kojeg je razvio Anthropic AI, može parirati GPT -4 tehničkim mjerilima i performansama u stvarnom svijetu u nekoliko područja. U nekim standardiziranim testovima, uključujući odabrane ispite, Claude 2 nadmašuje GPT-4. Jezični model umjetne inteligencije također ima znatno bolji kontekstni prozor na oko 100.000 tokena, u usporedbi s GPT -4 modelima od 8k i 32k tokena. Iako veća duljina konteksta ne znači uvijek bolju izvedbu, prošireni kapacitet Claude 2 pruža jasne prednosti, poput probave čitavih knjiga od 75.000 riječi za analizu.

U ukupnim performansama, GPT-4 ostaje superioran, ali naše interno testiranje pokazuje da ga Claude 2 premašuje u nekoliko zadataka kreativnog pisanja. Claude 2 također zaostaje za GPT-4 u programiranju i matematičkim vještinama na temelju naših procjena, ali se ističe u pružanju ljudskih, kreativnih odgovora. Kad smo potaknuli sve modele na ovom popisu da napišu ili prepišu kreativni rad, šest puta od deset, odabrali smo rezultat Claudea 2 zbog njegovih rezultata koji prirodno zvuče kao kod ljudi. Trenutno, Claude 2 dostupan je besplatno putem chatbota Claude AI. Tu je i plan koji se plaća 20 USD za pristup dodatnim značajkama.

Unatoč manjoj financijskoj potpori od divova kao što su OpenAI i Microsoft, Anthropicov Claude 2 AI model drži se u odnosu na popularne GPT modele i Googleovu seriju PaLM. Za AI s manje resursa, Claude 2 je impresivno konkurentan. Ako budemo prisiljeni kladiti se na to koji postojeći model ima najbolje šanse za pariranje GPT-u u bliskoj budućnosti, Claude 2 se čini najsigurnijim ulogom. Premda ga ima više od financiranja, napredne mogućnosti Claudea 2 sugeriraju da se može suprotstaviti čak i dobro financiranim divovima (iako je vrijedno napomenuti da je Google dao nekoliko velikih doprinosa antropski). Model je iznad svoje težine i obećava kao izazov u nastajanju.

3. OpenAI-jev GPT-3.5

Autor slike: Marcelo Mollaretti/Shutterstock

Iako je zasjenjen izdanjem GPT-4, GPT-3.5 i njegovih 175 milijardi parametara ne treba podcijeniti. Kroz iterativno fino podešavanje i nadogradnje usmjerene na performanse, točnost i sigurnost, GPT-3.5 je prešao dug put od izvornog GPT-3 modela. Iako mu nedostaju multimodalne mogućnosti GPT -4 i zaostaje u duljini konteksta i broju parametara, GPT-3.5 ostaje vrlo sposoban, a GPT-4 je jedini model koji može nadmašiti njegovu sveobuhvatnu izvedbu odlučno.

Unatoč tome što je drugorazredni model u GPT obitelji, GPT-3.5 može se održati i čak nadmašiti vodeće modele Googlea i Mete na nekoliko mjerila. U usporednim testovima matematičkih i programerskih vještina u usporedbi s Googleovim PaLM 2, razlike nisu bile velike, a GPT-3.5 čak je imao malu prednost u nekim slučajevima. Kreativniji zadaci poput humora i narativnog pisanja pokazali su da je GPT-3.5 odlučno napredovao.

Dakle, dok GPT-4 označava novu prekretnicu u umjetnoj inteligenciji, GPT-3.5 ostaje impresivno moćan model, sposoban se natjecati i ponekad nadmašiti čak i najnaprednije alternative. Njegovo kontinuirano usavršavanje osigurava da ostaje relevantan čak i pored blještavijih modela sljedeće generacije.

4. Googleov PaLM 2

Kredit za sliku: Google

Kada se procjenjuju mogućnosti AI modela, dokazana formula je pročitati tehničko izvješće i provjerite referentne rezultate, ali uzmite sve što ste naučili s rezervom i testirajte model sami. Koliko god se činilo kontraintuitivnim, rezultati usporedne analize nisu uvijek u skladu s performansama u stvarnom svijetu za neke modele umjetne inteligencije. Na papiru, Googleov PaLM 2 trebao je biti ubojica GPT-4, a službeni rezultati testa sugeriraju da odgovara GPT-4 u nekim mjerilima. Međutim, u svakodnevnoj uporabi pojavljuje se drugačija slika.

U logičkom zaključivanju, matematici i kreativnosti, PaLM 2 zaostaje za GPT-4. Također zaostaje za Anthropicovim Claudeom u nizu zadataka kreativnog pisanja. Međutim, iako ne uspijeva ispuniti svoju naplatu kao GPT-4 ubojica, Googleov PaLM 2 ostaje snažan jezični model sama po sebi, s golemim mogućnostima. Velik dio negativnog raspoloženja oko njega proizlazi iz usporedbi s modelima poput GPT-4, a ne iz potpuno loših performansi.

S 340 milijardi parametara, PaLM 2 je među najvećim svjetskim modelima. Osobito se ističe u višejezičnim zadacima i posjeduje snažne matematičke i programerske sposobnosti. Iako nije najbolji u tome, PaLM 2 također je prilično učinkovit u kreativnim zadacima poput pisanja. Dakle, dok su mjerila davala optimističnu sliku koja se nije u potpunosti materijalizirala, PaLM 2 još uvijek pokazuje impresivne vještine umjetne inteligencije, čak iako ne nadmašuje sve konkurente u svim segmentima.

5. TII-jev Falcon-180B

Osim ako niste pratili brzi tempo izdanja modela jezika umjetne inteligencije, vjerojatno se nikada niste susreli s Falcon-180B. Razvijen od strane Instituta za tehnološke inovacije UAE, Falcon-180 od 180 milijardi parametara jedan je od najmoćnijih otvoreni izvorni jezični modeli vani, čak i ako im nedostaje prepoznavanje naziva GPT modela ili široka upotreba Meta Lama 2. Ali nemojte pogriješiti - Falcon-180B može stajati rame uz rame s najboljima u klasi.

Rezultati benchmarka otkrivaju da Falcon-180B nadmašuje većinu modela otvorenog koda i natječe se s komercijalnim moćnicima poput PaLM 2 i GPT-3.5. U testiranju zadataka matematike, kodiranja, zaključivanja i kreativnog pisanja, čak je nadmašio GPT-3.5 i PaLM 2 na puta. Ako rangiramo GPT-4, GPT-3.5 i Falcon-180B, Falcon-180B bismo smjestili ravno između GPT-4 i GPT-3.5 zbog njegove snage u nekoliko slučajeva upotrebe.

Iako ne možemo sa sigurnošću reći da je bolji od GPT-3.5 u sveukupnim performansama, on čini slučaj za sebe. Iako je nejasan, ovaj model zaslužuje pozornost jer odgovara ili premašuje mogućnosti poznatijih alternativa. Model Falcon-180B možete isprobati na Lice koje grli (LLM platforma otvorenog koda).

Llama 2, veliki jezični model Meta AI od 70 milijardi parametara, temelji se na svom prethodniku, Llama 1. Iako manji od vodećih modela, Llama 2 značajno nadmašuje većinu javno dostupnih LLM-ova otvorenog koda u mjerilima i stvarnoj uporabi. Iznimka bi bio Falcon-180B.

Testirali smo Llamu 2 u odnosu na GPT-4, GPT-3.5, Claude 2 i PaLM 2 kako bismo procijenili njegove mogućnosti. Nije iznenađujuće, GPT-4 je nadmašio Llamu 2 po gotovo svim parametrima. Međutim, Llama 2 se u nekoliko procjena držao protiv GPT-3.5 i PaLM 2. Iako bi bilo netočno tvrditi da je Llama 2 superiorniji od PaLM-a 2, Llama 2 je riješio mnoge probleme koji su smetali PaLM-u 2, uključujući zadatke kodiranja. Claude 2 i GPT-3.5 nadmašili su Llamu 2 u nekim područjima, no bili su odlučno bolji samo u ograničenom broju zadataka.

Dakle, iako ne premašuje mogućnosti najvećih vlasničkih modela, open-source Llama 2 nadmašuje svoju težinsku kategoriju. Za otvoreno dostupan model, pokazuje impresivne performanse, parirajući AI divovima poput PaLM 2 u odabranim procjenama. Llama 2 daje uvid u budući potencijal jezičnih modela otvorenog koda.

Razlika u izvedbi između AI modela se smanjuje

Iako se umjetna inteligencija razvija munjevitom brzinom, OpenAI-jev GPT-4 ostaje predvodnik. Međutim, dok GPT-4 ostaje bez premca u veličini i izvedbi, modeli poput Claude 2 pokazuju da se uz dovoljno vještine manji modeli mogu natjecati u odabranim područjima. Googleov PaLM 2, unatoč tome što nije ispunio neka visoka očekivanja, još uvijek pokazuje značajne mogućnosti. A Falcon-180B dokazuje da inicijative otvorenog koda mogu stajati rame uz rame s titanima industrije koji imaju dovoljno resursa.