GPT modeli OpenAI-ja napravili su revoluciju u obradi prirodnog jezika (NLP), ali osim ako ne plaćate premiju pristup uslugama OpenAI-ja, nećete moći fino podesiti i integrirati njihove GPT modele u svoje aplikacije. Nadalje, OpenAI će imati pristup svim vašim razgovorima, što može biti sigurnosni problem ako koristite ChatGPT za posao i druga osjetljivija područja vašeg života. Ako niste oduševljeni ovime, možda biste trebali isprobati GPT4All.

Što je zapravo GPT4All? Kako radi i zašto ga koristiti umjesto ChatGPT-a?

Što je GPT4All?

GPT4All je ekosustav otvorenog koda koji se koristi za integraciju LLM-a u aplikacije bez plaćanja pretplate na platformu ili hardver. Kreirao ga je Nomic AI, tvrtka za informacijsku kartografiju koja ima za cilj poboljšati pristup resursima umjetne inteligencije.

GPT4All je dizajniran za rad na modernim do relativno modernim računalima bez potrebe za internetskom vezom ili čak GPU-om! To je moguće budući da je većina modela koje pruža GPT4All kvantizirana tako da budu mali od nekoliko gigabajta, zahtijevajući samo 4–16 GB RAM-a za rad.

instagram viewer

To omogućuje manjim tvrtkama, organizacijama i neovisnim istraživačima da koriste i integriraju LLM za određene aplikacije. A uz GPT4All koji se lako instalira putem programa za instalaciju jednim klikom, ljudi sada mogu koristiti GPT4All i mnoge od njegovih LLM-ova za stvaranje sadržaja, pisanje koda, razumijevanje dokumenata i informacija prikupljanje.

Zašto koristiti GPT4ALL umjesto ChatGPT-a?

Autorstvo slike: bruce mars/Unsplash

Postoji nekoliko razloga zašto biste mogli koristiti GPT4All preko ChatGPT-a.

  • Prenosivost: Modeli koje nudi GPT4All zahtijevaju samo četiri do osam gigabajta memorije za pohranu, ne zahtijevaju GPU za rad i mogu se jednostavno spremiti na USB flash pogon s GPT4All instalacijskim programom jednim klikom. To čini GPT4All i njegove modele doista prijenosnim i upotrebljivim na bilo kojem modernom računalu.
  • Privatnost i sigurnost: Kao što je ranije objašnjeno, osim ako nemate pristup ChatGPT Plus-u, svim vašim ChatGPT konverzijama može pristupiti OpenAI. GPT4All je usmjeren na transparentnost i privatnost podataka; vaši će podaci biti spremljeni samo na vašem lokalnom hardveru osim ako ih namjerno ne podijelite s GPT4All kako biste pomogli u razvoju njihovih modela.
  • Izvanmrežni način rada: GPT je vlasnički model koji zahtijeva pristup API-ju i stalnu internetsku vezu za postavljanje upita ili pristup modelu. Ako izgubite internetsku vezu ili imate problem s poslužiteljem, nećete imati pristup ChatGPT-u. To nije slučaj s GPT4All. Budući da su svi podaci već pohranjeni na paketu od četiri do osam gigabajta, a zaključivanje se vrši lokalno, nije vam potrebna internetska veza za pristup modelima u GPT4All. Možete nastaviti razgovarati i fino podešavati svoj model čak i bez internetske veze.
  • Besplatno i otvorenog koda: Nekoliko LLM-ova koje pruža GPT4All licencirani su pod GPL-2. To svakome omogućuje fino podešavanje i integraciju vlastitih modela za komercijalnu upotrebu bez potrebe za plaćanjem licence.

Kako GPT4All radi

Kao što smo ranije spomenuli, GPT4All je ekosustav koji se koristi za obuku i implementaciju LLM-a lokalno na vašem računalu, što je nevjerojatan podvig! Obično bi za učitavanje standardnog LLM-a od 25-30 GB bilo potrebno 32 GB RAM-a i GPU poslovne razine.

Za usporedbu, LLM-ovi koje možete koristiti s GPT4All zahtijevaju samo 3GB-8GB prostora za pohranu i mogu raditi na 4GB-16GB RAM-a. To omogućuje pokretanje cijelog LLM-a na rubnom uređaju bez potrebe za GPU-om ili vanjskom pomoći u oblaku.

Hardverski zahtjevi za pokretanje LLM-ova na GPT4All značajno su smanjeni zahvaljujući kvantizaciji neuronske mreže. Smanjenjem težine preciznosti i aktivacija u neuronskoj mreži, mnogi modeli koje nudi GPT4All mogu se pokretati na većini relativno modernih računala.

Podaci o obuci korišteni u nekim od dostupnih modela prikupljeni su putem "hrpe", što su samo izvučeni podaci iz javno objavljenog sadržaja na internetu. Podaci se zatim šalju u Nomic AI bazu podataka Atlas AI, koja se može vidjeti na temelju korelacija na lako vidljivoj 2D vektorskoj karti (poznatoj i kao AI vektorska baza podataka).

Nomic AI obukom Groovy modela i korištenjem javno dostupnih podataka, Nomic AI je uspio objaviti model na otvorenoj GPL licenci koja omogućuje svakome da ga koristi, čak i za komercijalne aplikacije.

Kako instalirati GPT4All

Instalacija GPT4All je jednostavna, a sada kada je izdana GPT4All verzija 2, još je lakša! Najbolji način za instaliranje GPT4All 2 je preuzimanje programa za instalaciju jednim klikom:

Preuzimanje datoteka:GPT4All za Windows, macOS ili Linux (besplatno)

Sljedeće upute su za Windows, ali možete instalirati GPT4All na svaki glavni operativni sustav.

Nakon preuzimanja dvaput kliknite na instalacijski program i odaberite Instalirati. Windows Defender može smatrati instalaciju zlonamjernom jer Microsoftov proces davanja važećih potpisa aplikacijama trećih strana može potrajati dugo. Međutim, to bi se uskoro trebalo popraviti. U trenutku pisanja, sve dok ste aplikaciju GPT4All preuzeli sa službene web stranice, trebali biste biti sigurni. Kliknite na Svejedno instaliraj za instaliranje GPT4All.

Nakon što otvorite aplikaciju, morat ćete odabrati model koji ćete koristiti. GPT4ALL vam nudi nekoliko modela, od kojih će svi imati svoje prednosti i slabosti. Kako biste znali koji model preuzeti, evo tablice koja prikazuje njihove prednosti i slabosti.

Model

Veličina

Bilješka

Parametri

Tip

Kvantizacija

Hermes

7,58 GB

  • Na temelju uputa
  • Daje duge odgovore
  • Pripremljeno s 300 000 necenzuriranih uputa
  • Ne može se koristiti u komercijalne svrhe

13 milijardi

LlaMA

q4_0

GPT4All Falcon

3,78 GB

  • Brzi odgovori
  • Na temelju uputa
  • Licencirano za komercijalnu upotrebu

7 milijardi

Sokol

q4_0

Groovy

8 GB

  • Brzi odgovori
  • -Kreativni odgovori
  • Na temelju uputa
  • Licencirano za komercijalnu upotrebu

7 milijardi

GPT-J

q4_0

ChatGPT-3.5 Turbo

Minimalno

  • Zahtijeva osobni API
  • Poslat će vaše razgovore na OpenAI
  • GPT4All se koristi samo za komunikaciju s OpenAI-jem

?

GPT

NA

ChatGPT-4

Minimalno

  • Zahtijeva osobni API
  • Poslat će vaše razgovore na OpenAI
  • GPT4All se koristi samo za komunikaciju s OpenAI-jem

?

GPT

NA

Snoozy

7,58 GB

  • Na temelju uputa
  • Sporiji od Groovyja, ali s kvalitetnijim odgovorima
  • Ne može se koristiti u komercijalne svrhe

13 milijardi

LlaMA

q4_0

MPT Chat

4,52 GB

  • Brzi odgovori
  • Na temelju chata
  • Ne može se koristiti u komercijalne svrhe

7 milijardi

MPT

q4_0

Orka

3,53 GB

  • Na temelju uputa
  • Objašnjava podešene skupove podataka
  • Pristupi izgradnji skupa podataka Orca Research Paper
  • Licencirano za komercijalnu upotrebu

7 milijardi

OpenLLaMA

q4_0

Vikunja

3,92 GB

  • Na temelju uputa
  • Ne može se koristiti u komercijalne svrhe

7 milijardi

LlaMA

q4_2

čarobnjak

3,92 GB

  • Na temelju uputa
  • Ne može se koristiti u komercijalne svrhe

7 milijardi

LlaMA

q4_2

Čarobnjak bez cenzure

7,58 GB

  • Na temelju uputa
  • Ne može se koristiti u komercijalne svrhe

13 milijardi

LlaMA

q4_0

Imajte na umu da navedeni modeli imaju različite razine ograničenja. Ne mogu se svi modeli besplatno koristiti komercijalno; neki će trebati više hardverskih resursa, dok će drugi trebati API ključ. Najmanje restriktivni modeli dostupni u GPT4All su Groovy, GPT4All Falcon i Orca.

Možete li trenirati GPT4All modele?

Da, ali ne kvantizirane verzije. Za učinkovito fino podešavanje GPT4All modela, trebate preuzeti neobrađene modele i koristiti GPU-ove za poduzeća kao što su AMD-ovi Instinct akceleratori ili NVIDIA Ampere ili Hopper GPU. Osim toga, morat ćete uvježbati model kroz AI okvir za obuku kao što je LangChain, što će zahtijevati određeno tehničko znanje.

Fino podešavanje modela GPT4All zahtijevat će određena novčana sredstva, kao i nešto tehničkog znanja, ali ako samo želite unijeti prilagođene podatke modela GPT4All, možete nastavite uvježbavati model kroz generiranje proširenog dohvaćanja (što pomaže jezičnom modelu pristupiti i razumjeti informacije izvan svoje osnovne obuke za dovršetak zadaci). To možete učiniti tako da zatražite od GPT4All da modelira vaše prilagođene podatke prije postavljanja pitanja. Prilagođeni podaci trebali bi se spremati lokalno, a kada se to od vas zatraži, model bi vam trebao moći pružiti informacije koje ste dali.

Trebate li koristiti GTP4All?

Ideja GPT4All je pružiti besplatnu platformu otvorenog koda na kojoj ljudi mogu pokretati velike jezične modele na svojim računalima. Trenutno su GPT4All i njegovi kvantizirani modeli izvrsni za eksperimentiranje, učenje i isprobavanje različitih LLM-ova u sigurnom okruženju. Za profesionalna radna opterećenja ipak bismo preporučili korištenje ChatGPT-a jer je model znatno sposobniji.

Općenito, nema razloga da se ograničite na jedan. Budući da se njihov slučaj upotrebe ne preklapa, pokušajte koristiti oba.