OpenAI je ChatGPT-u dao mogućnost govora sintetiziranim glasom, a uskoro dolazi i na vaš pametni telefon.

ChatGPT bi trebao postati interaktivno generativno AI iskustvo. OpenAI je otkrio da će vodeći svjetski AI chatbot moći govoriti i odgovarati na korisničke upite koristeći sintetizirani, vjerojatno generirani AI, glas.

Zajedno sa svojim novootkrivenim glasom, ChatGPT će također moći odgovoriti i raspravljati o određenim slikama koje su učitane ili snimljene tijekom korištenja ChatGPT Android ili iOS aplikacije. Značajka prepoznavanja slike zvuči slično Google Lensu i drugim aplikacijama koje koriste neuronske mreže za točno otkrivanje podataka i informacija.

OpenAI daje ChatGPT-u glas

Dana 25. rujna 2023., ChatGPT programer OpenAI otkriven dao bi glas svom vodećem svjetskom generativnom AI chatbotu. Korisnici ChatGPT-a mogu razgovarati izravno s chatbotom i zatražiti da im uzvrati, omogućujući ChatGPT-u da po prvi put izravno razgovara glasom.

OpenAI-jev primjer isječka prikazuje ženu koja traži od ChatGPT-a da stvori jedinstvenu priču za laku noć, na što ChatGPT uredno odgovara sintetiziranim ženskim glasom.

instagram viewer

Prema Ožičeno, novi model pretvaranja teksta u govor razvijen je unutar tvrtke. Može generirati zvuk "kao kod ljudi" iz teksta i nekoliko sekundi uzorka govora (pomoću modela OpenAI Whisper) i govore različitim tonovima i stilovima. Možete pronaći niz glasovnih uzoraka na OpenAI blog.

Neke tvrtke već koriste OpenAI-jev novi glasovni model. Na primjer, Spotify koristi OpenAI-jev model pretvaranja teksta u govor za prevođenje podcasta na različite jezike, kombinirajući ChatGPT-ovo umijeće prevođenja jezika s novom sposobnošću govora.

ChatGPT-ov novi model pretvaranja teksta u govor dostupan je samo pretplatnicima Plus i Enterprise koji koriste službeni Android i iOS aplikacije, a očekuje se da će biti predstavljena u sljedeća dva tjedna (počevši od 25. rujna 2023). Nadalje, nova glasovna značajka u početku je ograničena na engleski, iako bismo očekivali da će se to brzo promijeniti.

ChatGPT može prepoznati i analizirati slike i fotografije

Drugi dio OpenAI-jevog ChatGPT ažuriranja je mogućnost analiziranja i razgovora o slikama prenesenim na alat. Opcija vizualne analize slike predstavljena je u videozapisima ažuriranja GPT-4, ali od tada se o njoj nije puno raspravljalo (Na stranu ChatGPT Tumač koda).

Sada ChatGPT dobiva funkcionalnost sličnu Google Lensu. Možete prenijeti sliku na ChatGPT ili snimiti fotografiju pomoću kamere pametnog telefona u aplikaciji ChatGPT, a ona će prikazati detalje slike, dodajući više konteksta gdje je potrebno.

Nazivajući ga "sličnim Google Lensu" zapravo je nepravda. Mogućnost čavrljanja naprijed-natrag o slici radi dobivanja više informacija i konteksta čini je izuzetno korisnom za širok raspon postavki. Međutim, važno je primijetiti sitni tisak, pri čemu OpenAI jasno daje do znanja da je ograničio ChatGPT-ovu "sposobnost analiziranja i davanja izravnih izjava o ljudima" iz razloga privatnosti i točnosti. Ipak, može li se u budućnosti raditi na alatu "Tko je ovo" koji pokreće OpenAI? (Nadajmo se da neće!)

Kao i novi model pretvaranja teksta u govor, OpenAI će pokrenuti prepoznavanje slika u sljedeća dva tjedna, iako će biti dostupan na svim platformama, ne samo u aplikaciji ChatGPT.

Privatnost, sigurnost i druga pitanja

Implikacije glasovnog ChatGPT-a su oštre. Naravno, uzbudljivo je. Međutim, mogućnost stvaranja jedinstveno sintetiziranog glasa korištenjem samo kratkog isječka kao primjera ima značajna pitanja privatnosti i sigurnosti. Potencijal zlonamjernih aktera da iskoriste ove alate je ogroman, a kao i kod svakog generativnog AI alata, kada duh izađe iz boce, više se neće vratiti u nju. Nikakva regulacija AI od strane vlada ili misaonih vođa ne može vratiti plimu.

Čini se da čak i OpenAI-jevo upozorenje na tu temu zaobilazi očito unatoč spominjanju problema:

Međutim, ove mogućnosti također predstavljaju nove rizike, kao što je mogućnost zlonamjernih aktera da se lažno predstavljaju kao javne osobe ili počine prijevaru. To je razlog zašto koristimo ovu tehnologiju za pokretanje specifičnog slučaja upotrebe—glasovni chat.

S obzirom da je ovo vrh ledenog brijega, očekujte otpor novootkrivenom glasu ChatGPT-a, osobito jednom postoji predvidljiv porast neugodnih naslova koji tvrde da se ChatGPT koristi za počinjenje prijevare i tako na.

OpenAI pretvara ChatGPT u aplikaciju za umjetnu inteligenciju

Što više OpenAI dodaje značajke prilagođene korisniku ChatGPT-u, to više postaje generativna AI aplikacija. Kao prvi koji je dosegao široku slavu tijekom početnog generativnog procvata umjetne inteligencije, ChatGPT još uvijek prednjači i predstavlja jedina aplikacija koju neko koristi, unatoč konkurenciji poput Google Barda (i potencijalno Google Geminija) i Anthropica Claude.

Sve dok OpenAI može nastaviti dodavati značajke koje ChatGPT čine lakšim za korištenje, držat će ljude zaokupljenima i gurati sve bliže svom cilju istinski multimodalnog AI alata.