Prije više od 70 godina, kada je konceptualizirana umjetna inteligencija, Alan Turing objavio je rad koji opisuje kako je identificirati. Kasnije je postao poznat kao Turingov test, a koristio se desetljećima za razlikovanje čovjeka od umjetne inteligencije.
Međutim, s uvođenjem naprednih AI chatbota kao što su ChatGPT i Google Bard, postaje sve teže reći razgovarate li s AI. Postavlja se pitanje; je li Turingov test zastario? I ako jest, koje su alternative?
Je li Turingov test zastario?
Da biste utvrdili je li Turingov test zastario, prvo morate razumjeti kako to radi. Da bi umjetna inteligencija prošla Turingov test, mora uvjeriti ljudskog ispitivača da je čovjek. Ali postoji kvaka - AI se procjenjuje zajedno s čovjekom i mora odgovoriti koristeći tekst.
Zamislite to ovako; ako ste vi ispitivač i postavljate pitanja dvojici sudionika na mreži koristeći tekst, ali jedan od njih je AI model — biste li ih razlikovali nakon pet minuta? Imajte na umu da cilj Turingovog testa nije identificirati model umjetne inteligencije na temelju točnih odgovora, već procijeniti može li umjetna inteligencija razmišljati ili se ponašati kao čovjek.
Problem s pristupom Turingovog testa kojim se identificiraju samo odgovori nalik ljudskim jest taj što ne uzima u obzir druge čimbenike. Na primjer, inteligencija AI modela ili znanje ispitivača. Osim toga, Turingov test ograničen je samo na tekst i postaje sve teže identificirati AI koja generira ljudski glas ili deepfake videa koji oponašaju ljudsko ponašanje.
Međutim, trenutni AI modeli poput ChatGPT-4 i Google Bard još nisu napredovali do točke na kojoj mogu dosljedno proći Turingov test. Zapravo, ako ste upoznati s umjetnom inteligencijom, možete uočiti tekst generiran umjetnom inteligencijom.
5 najboljih alternativa Turingovom testu
Moguće je da budući AI modeli poput ChatGPT-5 mogao proći Turingov test. Ako se to dogodi, trebat će nam različiti testovi u kombinaciji s Turingovim testom kako bismo utvrdili razgovaramo li s umjetnom inteligencijom ili čovjekom. Evo najboljih alternativa Turingovom testu:
1. Marcusov test
Gary Marcus, poznati kognitivni znanstvenik i istraživač umjetne inteligencije, predložio je alternativu Turingovom testu koji je objavljen u New Yorker identificirati kognitivnu sposobnost umjetne inteligencije. Test je jednostavan - model umjetne inteligencije prosuđujete na temelju njegove sposobnosti da gleda i razumije YouTube videozapise i TV emisije bez titlova ili teksta. Da bi umjetna inteligencija prošla Marcusov test, trebala bi razumjeti sarkazam, humor, ironiju i priču tijekom gledanja videa i objasniti to poput čovjeka.
Trenutno, GPT-4 može opisati slike, ali za sada trenutno ne postoji AI model koji može shvatiti videozapise poput čovjeka. Samovozeća vozila približe se, ali nisu potpuno autonomne i zahtijevaju senzore budući da ne mogu shvatiti sve što ih okružuje.
2. Vizualni Turingov test
Prema istraživačkom radu objavljenom na PNAS, vizualni Turingov test može se koristiti za prepoznavanje razgovarate li s čovjekom ili umjetnom inteligencijom pomoću slikovnih upitnika. Djeluje poput Turingovog testa, ali umjesto odgovaranja na pitanja korištenjem tekstova, sudionicima se prikazuju slike i očekuje se da odgovore na jednostavna pitanja dok razmišljaju kao ljudi. Međutim vizualni Turingov test razlikuje se od CAPTCHA budući da su svi odgovori točni—ali da bi prošao test, umjetna inteligencija mora obraditi slike slično čovjeku.
Osim toga, ako se umjetnoj inteligenciji i čovjeku prikaže više slika jedna pored druge i od njih se zatraži da identificiraju realistične slike, čovjek bi imao kognitivnu sposobnost proći test. To je zato što je AI modelima teško razlikovati slike koje ne izgledaju kao da su snimljene u stvarnom svijetu. Zapravo, to je razlog zašto možete identificirati slike generirane umjetnom inteligencijom koristeći anomalije koje nemaju smisla.
3. Test Lovelace 2.0
Teoriju da računalo ne može stvarati originalne ideje izvan onoga za što je programirano prva je konceptualizirala Ada Lovelace prije Turingovog testa. Međutim, Alan Turing usprotivio se toj teoriji tvrdeći da AI još uvijek može iznenaditi ljude. Tek 2001. razvijene su smjernice za Lovelace test kako bi se razlikovala umjetna inteligencija od čovjeka—i, prema thekurzweillibrary pravila su kasnije revidirana 2014.
Da bi umjetna inteligencija prošla test Lovelace, mora pokazati da može generirati originalne ideje koje nadilaze njegovu obuku. Trenutačni AI modeli poput GPT-4 nemaju sposobnost osmisliti nove izume izvan našeg postojećeg znanja. Međutim, umjetna opća inteligencija može postići tu sposobnost i položiti Lovelace test.
4. Obrnuti Turingov test
Što kažete na Turingov test, ali obrnuto? Umjesto da pokušavate otkriti razgovarate li s čovjekom, cilj je obrnuti Turingov test je prevariti AI da povjeruje da ste AI. Međutim, potreban vam je i drugi AI model da odgovorite na ista pitanja koristeći tekst.
Na primjer, ako je ChatGPT-4 ispitivač, možete prijaviti Google Barda i još jednog čovjeka kao sudionike. Ako AI model može ispravno identificirati ljudskog sudionika na temelju odgovora, prošao je test.
Loša strana obrnutog Turingovog testa je ta što je nepouzdan, pogotovo imajući u vidu da ponekad AI ne može razlikovati stvoreno AI-jem i sadržaj koji su napisali ljudi.
5. AI Klasifikacijski okvir
Prema klasifikacijskom okviru AI koji je razvio Chris Saad, Turingov test samo je jedna od metoda procjene da znate razgovarate li s umjetnom inteligencijom. Jezgrovitije, klasifikacijski okvir umjetne inteligencije temelji se na teoriji višestruke inteligencije, koja zahtijeva da ljudska inteligencija zadovolji najmanje osam različitih kriterija, koji uključuju: glazbeno-ritamsku, logičko-matematičku inteligenciju, vizualnu identifikaciju, emocionalnu inteligenciju, samorefleksivnu inteligenciju, egzistencijalnu sposobnost razmišljanja i tijelo pokret.
Budući da se AI procjenjuje na temelju osam različitih parametara, malo je vjerojatno da će proći za čovjeka čak i ako radi bolje od prosjeka u određenim mjerilima. Na primjer, ChatGPT može riješiti matematičke probleme, opisivati slike i razgovarati prirodnim jezikom poput čovjeka, ali ne bi zadovoljio ostale kategorije definirane u okviru klasifikacije umjetne inteligencije.
Turingov test nije konačan
Turingov test trebao je biti više misaoni eksperiment nego konačni test za razlikovanje ljudi od umjetne inteligencije. Kada je inicijalno predložen, bio je ključno mjerilo za mjerenje inteligencije strojeva.
Međutim, s nedavnim razvojem AI modela s govornim, vizualnim i slušnim interaktivnim mogućnostima, Turingov test nije uspješan jer je ograničen na tekstualni razgovor. Najučinkovitije rješenje bilo bi uvesti alternative Turingovog testa koje dodatno razlikuju modele umjetne inteligencije od ljudskih.