AI alati u glazbenoj produkciji nisu ništa novo. Ali što je s glazbom generiranom od nule pomoću umjetne inteligencije? I to je sada realnost.

Generativna umjetna inteligencija polako se širi na sve više disciplina u kreativnoj industriji. Započelo je s AI umjetničkim generatorima, a zatim se proširilo na pisanje s AI generiranim tekstom. Sada možemo dodati glazbu na taj popis.

U bliskoj budućnosti, glazba generirana umjetnom inteligencijom, stvorena od nule, postat će stvarnost. Zapravo, to već postoji mogućnost s Jukeboxom, OpenAI-jevim AI modelom za stvaranje glazbe. Još nije dostupan u aplikaciji jednostavnoj za korištenje i još ne zvuči dovoljno dobro, ali algoritamske kosti su tu.

Evo što trebate znati o OpenAI Jukeboxu i što možete učiniti s njim.

Jukebox: AI koji generira glazbu kao neobrađeni zvuk

Jukebox je neuronska mreža koja može generirati glazbu u neobrađenom audio obliku kada joj date unos poput žanra, izvođača ili teksta. U travnju 2020. objavio ga je OpenAI, ista tvrtka koja nam je donijela umjetnički generator umjetne inteligencije pod nazivom Dall-E i AI chatbot pod nazivom ChatGPT.

Za razliku od Dall-E-a, koji se brzo proširio svijetom i učinio umjetnu inteligenciju vrućom temom vijesti i medija, Jukebox nije zabilježio široku lepezu interesa nakon objavljivanja. Jedan od razloga za to je taj što nema web aplikaciju jednostavnu za korištenje—barem ne još.

Kod možete pronaći na OpenAI web mjesto, zajedno s detaljnim objašnjenjem kako funkcionira proces kodiranja i dekodiranja.

Drugi vjerojatni razlog je taj što oduzima ogromnu količinu vremena i računalne snage. Da bismo vam dali ideju, renderiranje samo jedne minute zvuka može trajati 9 sati. Trebat će vam volja da istražite model u obliku koda, plus puno strpljenja ako želite vidjeti što AI model može učiniti za generiranje glazbe.

Ili, možete preskočiti na Jukebox Sample Explorer. Ovo je mjesto gdje je OpenAI objavio svoje eksperimente generiranja pjesama nalik na Ellu Fitzgerald ili 2Pac.

Da bude jasno, druge AI glazbene alate postoje kako bi vam pomogli generirati pjesmu, ali oni ne generiraju zvuk od nule. Umjesto toga, oni ili kombiniraju unaprijed snimljene uzorke ili stvaraju MIDI informacije koje se propuštaju kroz digitalni sintesajzer.

Kako zvuči Jukebox?

Rezultati Jukeboxa su prepoznatljivi, ali čudni. Nije teško razumjeti oblik pjesme i žanr kojem pripada, već kvalitetu rezultata čini da zvuči kao da slušate neku od najranijih snimljenih pjesama: to jest, prigušenu s mnogo buka.

Sa sigurnošću se može reći da Jukebox ne proizvodi zvuk visoke vjernosti kakav biste čuli iz para dobrih slušalica. To je više slično slušanju glazbe s radio postaje koja nije u potpunosti podešena na pravu frekvenciju. Neke pjesme su prepjevi dok su druge nastavci postojećih pjesama. Postoji i kategorija za autore i stilove romana te neviđene tekstove.

Unatoč kvaliteti zvuka, rani eksperimentatori opisuju kako su bili zadivljeni jezivom ljepotom i bizarnom prirodom glazbe koju je stvorio Jukebox. "Kao soundtrack za dokumentaciju o nepoznatoj zemlji s nepoznatom kulturom", piše Merzmench na Mediumu.

Trenutačno su rezultati daleko od dovoljno dobrih za kopiranje ili čak zamjenu glazbe koju su stvorili ljudi, ali tehnologija se brzo kreće i uskoro će modeli poput Jukeboxa moći postići te podvige isto.

Kako je treniran OpenAI-jev Jukebox

Dio načina na koji Jukebox može stvarati glazbu koja nikada prije nije postojala je to što je treniran na glazbi pravih glazbenika. OpenAI objašnjava sljedeće:

"Kako bismo uvježbali ovaj model, indeksirali smo web kako bismo pripremili novi skup podataka od 1,2 milijuna pjesama (od kojih je 600.000 na engleskom), uparenih s odgovarajućim tekstovima i metapodacima iz LyricWikija."

Pretraga podataka praksa je koju koriste neke AI tvrtke za stvaranje skupa podataka koje AI model može koristiti za učenje i donošenje odluka prilikom generiranja slike, teksta - ili u ovom slučaju - glazbe. Skupovi podataka stvoreni indeksiranjem kontroverzni su jer se pristanak ne dobiva od vlasnika podataka. Iako vam neke platforme to omogućuju isključite svoj sadržaj iz skupova podataka.

Možda mislite da je 1,2 milijuna pjesama puno, ali za usporedbu, Dall-E 2 je treniran na stotinama milijuna parova slika-tekst s interneta. Imajući to na umu, Jukebox ima svoja ograničenja.

Njegov relativno mali bazen za obuku ne može obuhvatiti bogatstvo i raznolikost ljudske glazbe. OpenAI je izjavio da je uglavnom obučen na zapadnjačkoj glazbi, što predstavlja jasnu pristranost u pogledu glazbe koju je sposoban generirati.

Što možete učiniti s Jukeboxom?

Dakle, imajući na umu njegova ograničenja, što možete učiniti s Jukeboxom? Brz način da odgovorite na to pitanje je reći što ne možete učiniti s Jukeboxom.

Budući da je potrebno skoro pola dana za renderiranje jedne minute glazbe, nije baš korisno za proizvodnju glazbe. Barem ne u tradicionalnom smislu. Obično se glazbenici kreću naprijed-natrag između sviranja na instrumentu (improviziranja) i planiranja strukture pjesme. Ista vrsta eksperimentiranja nije moguća s Jukeboxom.

Budući da u ovoj fazi nije lako izraditi pjesmu s Jukeboxom, o tome više možete razmišljati kao o novom načinu generiranja glazbenih uzoraka. Nakon što generirate zvuk koji vam se sviđa, možete ga koristiti u svojim kreativnim projektima kao što biste to inače činili.

Videozapis u nastavku rezultat je nekoga tko je koristio glazbu stvorenu pomoću Jukeboxa kako bi naglasio kratki montažni video.

Umjetna inteligencija ima širok raspon primjena i izvan kreativnih primjena, zbog čega je vrijedna razumijevanje što je AI i opasnosti koje predstavlja.

Dirnu li vas AI Music?

Glazbu koju generira Jukebox nije lako odbaciti, a usprkos svoj svojoj neobičnosti i jezivoj ljudsko-strojnoj kvaliteti, na kraju ipak zvuči poput glazbe. Iako glazbena industrija već neko vrijeme koristi AI alate, mogućnost generiranja glazbe kao sirovog zvuka tek je sada stvarnost.

No iako modeli poput Jukeboxa postoje, tek trebaju biti upakirani u komercijalni alat i još uvijek nedostižu mogućnosti ljudskih glazbenika.