Dostupno je mnogo chatbota pokretanih umjetnom inteligencijom, ali koji koristi najbolji LLM? Evo kako možete usporediti doktorske studije da biste utvrdili koji je najbolji.
Uz nekoliko chatbota dostupnih online, može postati iznimno teško odabrati onaj koji zadovoljava vaše potrebe. Iako možete ručno usporediti bilo koja dva chatbota, to će oduzeti dosta vremena i truda.
Bolji i jednostavniji način je korištenje Chatbot Arene za usporedbu različitih LLM-ova koji pokreću popularne chatbotove. Nudi nekoliko načina za usporedbu različitih modela, koje objašnjavamo u nastavku.
Što je Chatbot Arena?
Kreirana od strane LMSYS Org, Chatbot Arena je platforma za usporedbu različitih LLM-ova. Za rangiranje različitih modela koristi sustav Elo Rating.
Chatbot Arena korisnicima nudi nekoliko načina za usporedbu i ocjenjivanje LLM-ova. Na temelju poslanih povratnih informacija, Chatbot Arena rangira različite LLM-ove na javnoj ljestvici najboljih. Projekt je sponzoriran od HuggingFace, open-source alternativa ChatGPT-u.
Kako usporediti anonimne LLM s Chatbot Arenom
Način borbe u Chatbot Areni omogućuje anonimnu usporedbu LLM-ova. Na primjer, možete usporedite ChatGPT (GPT 3.5) i Claude. To znači da Chatbot Arena sama odabire bilo koja dva jezična modela i, ne otkrivajući njihova imena, omogućuje vam da ih usporedite.
Dok upisujete prvi upit, Chatbot Arena dohvaća odgovore od oba modela, prikazujući ih jedan pored drugog. Platforma vam omogućuje ponovno generiranje odgovora (za oba LLM-a) i brisanje povijesti kako biste započeli drugačiji razgovor. Možete nastaviti postavljati dodatna pitanja dok ne odaberete jasnog pobjednika.
Zatim možete odabrati je li model A bolji ili B. Prilikom odabira pobjednika, Chatbot Arena otkriva imena oba bota. Ovaj način funkcionira izvrsno jer vaša prethodna percepcija ili popularnost modela ne utječe na vašu odluku. Chatbot Arena vam također omogućuje podešavanje parametara kao što su temperatura, Top P i maksimalni izlazni tokeni.
Kako usporediti odabrane LLM s Chatbot Arenom
Ako želite usporediti bilo koja dva specifična LLM-a, možete se prebaciti na usporedni način rada Chatbot Arene. Osim činjenice da sami možete birati LLM-ove, ovaj način funkcionira gotovo isto kao način borbe. Možete prilagoditi parametre, regenerirati odgovore, izbrisati povijest i na kraju odabrati pobjednika.
Međutim, broj LLM-ova dostupnih u ovom načinu je ograničen. Možete odabrati različite verzije Llama 2, Vicuna i ChatGLM. Iako su popularni LLM-ovi, poput GPT-4, GPT-3.5, Claude 1, Claude 2 itd., trenutno nedostupni u ovom načinu rada, Chatbot Arena ih planira dodati.
Usporedite LLM-ove koristeći Chatbot Arenu
Bilo da želite pronaći odgovarajućeg chatbota za svoje potrebe ili samo želite testirati različite LLM-ove, Chatbot Arena je izvrsna platforma.
Omogućuje pojednostavljeni način usporedbe različitih jezičnih modela. A budući da održava ljestvicu najboljih na temelju povratnih informacija korisnika, možete izravno vidjeti rangiranje različitih modela bez da sami pokrećete testove.