GPT-4 je ovdje, a ovo su nove značajke koje biste trebali provjeriti.

OpenAI je konačno lansirao svoje dugo očekivano GPT ažuriranje, GPT-4. Large Language Model (LLM) dolazi s nekim snažnim novim značajkama i mogućnostima koje su već šokirale korisnike diljem svijeta.

Osim što je značajno bolji od GPT-3.5, postojeći LLM koji pokreće OpenAI-jev viralni chatbot ChatGPT, GPT-4 može razumije složenije unose, ima daleko veće ograničenje unosa znakova, ima multimodalne mogućnosti i navodno je sigurnije za koristiti.

1. GPT-4 može razumjeti složenije unose

Jedna od najvećih novih značajki GPT-4 je njegova sposobnost razumijevanja složenijih i nijansiranih upita. Prema OpenAI, GPT-4 "pokazuje performanse na ljudskoj razini na raznim profesionalnim i akademskim mjerilima."

To je dokazano polaganjem GPT-4 kroz nekoliko ispita na ljudskoj razini i standardiziranih testova, kao što su SAT, BAR i GRE, bez posebne obuke. Ne samo da je GTP-4 razumio i riješio te testove s relativno visokim rezultatom na svim razinama, nego je također svaki put pobijedio svog prethodnika, GPT-3.5.

instagram viewer
Kredit za sliku: OpenAI

Sposobnost razumijevanja nijansiranih upita za unos također je potpomognuta činjenicom da GPT-4 ima puno veće ograničenje broja riječi. Novi model može obraditi upite za unos do 25.000 riječi (za kontekst, GPT-3.5 je bio ograničen na 8.000 riječi). To će izravno utjecati na detalje koje korisnici mogu ugurati u svoje upite, dajući modelu mnogo više informacija s kojima može raditi i producirati duže rezultate.

GPT-4 također podržava više od 26 jezika, uključujući jezike s malo resursa kao što su latvijski, velški i svahili. Kada se usporedi s preciznošću od tri metka na MMLU mjerilu, GPT-4 je pobijedio GPT-3.5 kao i druge vodeće LLM-ove kao što su PaLM i Chinchilla u pogledu performansi na engleskom jeziku na 24 jezika.

2. Multimodalne mogućnosti

Prethodna verzija ChatGPT bio je ograničen samo na tekstualne upite. Nasuprot tome, jedna od najnovijih značajki GPT-4 je njegova multimodalna sposobnost. Model može prihvatiti i tekstualne i slikovne upite.

To znači da umjetna inteligencija može prihvatiti sliku kao unos te je interpretirati i razumjeti baš kao tekstualni upit. Ova mogućnost obuhvaća sve veličine i vrste slika i teksta, uključujući dokumente koji kombiniraju to dvoje, ručno nacrtane skice, pa čak i snimke zaslona.

Međutim, GPT-4 mogućnosti čitanja slika nadilaze njihovo jednostavno tumačenje. OpenAI je to predstavio u svom streamu za razvojne programere (iznad), gdje su GPT-4 pružili ručno nacrtanim modelom web stranice s šalama. Model je dobio zadatak da napiše HTML i JavaScript kod kako bi maketu pretvorio u web stranicu dok je šale zamijenio stvarnim.

GPT-4 je napisao kod koristeći izgled naveden u maketi. Nakon testiranja, kod je proizveo radno mjesto sa, kao što možete pretpostaviti, stvarnim šalama. Da li to znači Napredak umjetne inteligencije značit će kraj programiranja? Ne baš, ali to je još uvijek značajka koja će dobro doći kao pomoć programerima.

Koliko god se ova značajka čini obećavajućom, još uvijek je u fazi istraživanja i nije javno dostupna. Osim toga, modelu je potrebno puno vremena za obradu vizualnih ulaza, a sam OpenAI navodi da bi mogao trebati puno vremena i rada da postane brži.

3. Veća upravljivost

OpenAI također tvrdi da GPT-4 ima visok stupanj upravljivosti. Također je AI-ju otežalo razbijanje karaktera, što znači da je manja vjerojatnost da neće uspjeti kada se implementira u aplikaciju za igranje određenog lika.

Programeri mogu propisati stil i zadatak svoje umjetne inteligencije opisivanjem smjera u poruci "sustav". Ove poruke omogućuju korisnicima API-ja da snažno prilagode korisničko iskustvo unutar određenih granica. Budući da su te poruke ujedno i najlakši način za "jailbreak" modela, također rade na tome da ih učine sigurnijima. Demo za GPT-4 zakucao je ovu točku tako što je natjerao korisnika da pokuša spriječiti GPT-4 da bude Sokratov učitelj i odgovori na njihov upit. Međutim, model je odbio slomiti karakter.

4. Sigurnost

OpenAI je proveo šest mjeseci praveći GPT-4 sigurnije i usklađenije. Tvrtka tvrdi da je 82% manja vjerojatnost da će odgovoriti na zahtjeve za neprikladnim ili na drugi način nedopuštenim sadržajem, 29% veća vjerojatnost odgovarati u skladu s pravilima OpenAI-ja na osjetljive zahtjeve i 40% je vjerojatnije da će proizvesti činjenične odgovore u usporedbi s GPT-3.5.

Nije savršen i još uvijek možete očekivati ​​da će s vremena na vrijeme "halucinirati" i pogriješiti u svojim predviđanjima. Naravno, GPT-4 ima bolju percepciju i moć predviđanja, ali ipak ne biste trebali slijepo vjerovati AI-ju.

5. Poboljšanja performansi

Osim ocjenjivanja izvedbe modela na ljudskim ispitima, OpenAI je također procijenio bot na tradicionalnim mjerilima dizajniranim za modele strojnog učenja.

Tvrdi se da GPT-4 "znatno nadmašuje" postojeće LLM-ove i "najsuvremenije modele". Ova mjerila uključuju gore spomenuti MMLU, AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval i Drop, koji testiraju pojedinačne sposobnosti.

Naći ćete slične rezultate uspoređujući performanse na referentnim vrijednostima akademske vizije. Testovi koji se izvode uključuju VQAv2, TextVQA, ChartQA, AI2 dijagram (AI2D), DocVQA, Infographic VQA, TVQA i LSMDC, od kojih je GPT-4 najbolji. Međutim, OpenAI je izjavio da rezultati GPT-4 u ovim testovima "ne predstavljaju u potpunosti opseg njegovih mogućnosti" budući da istraživači neprestano pronalaze nove i izazovnije stvari s kojima se model može uhvatiti u koštac.

Mali korak za GPT-4, Veliki skok za AI

Uz veću točnost, sigurnost korištenja i napredne mogućnosti, GPT-4 je pušten u javnost putem ChatGPT+ mjesečnog pretplatničkog plana koji košta 20 mjesečno. Osim toga, OpenAI se udružio s različitim organizacijama kako bi s GPT-4 započeo s izradom proizvoda namijenjenih potrošačima. Microsoft Bing, Duolingo, Stripe, Be My Eyes i Khan Academy, između ostalih, već su implementirali GPT-4 u svoje proizvode.

GPT-4 je možda inkrementalno ažuriranje u odnosu na GPT-3.5, ali to je velika pobjeda za AI općenito. Kako model postaje pristupačniji, i prosječnom korisniku i programerima putem svog API-ja, čini se da će biti dobar slučaj za implementacije LLM-a u različitim područjima.