Modeli umjetne inteligencije poput ChatGPT-a i Barda treniraju se pomoću podataka koje su stvorili ljudi. Što više podataka unose, to postaju pametniji u oponašanju ljudske inteligencije i kreativnosti. Veliki igrači u industriji umjetne inteligencije, poput OpenAI-ja i Mete, postavili su velike jezične modele koji su obučeni izvlačenjem podataka iz teksta i knjiga dostupnih na internetu.
Zbog načina na koji se LLM obučavaju, bilo je neizbježno da će doći do sukoba između zakona o autorskim pravima i umjetne inteligencije. Sada se kokoši vraćaju kući na kokošinjac, jer Sarah Silverman i drugi umjetnici tuže OpenAI i Metu zbog kršenja autorskih prava.
U kolektivna tužba [PDF] podnesen u Kaliforniji, komičarka Sarah Silverman i drugi pisci (Christopher Golden i Richard Kadrey) traže nadoknadu štete protiv OpenAI-ja i Mete zbog kršenja autorskih prava. U tužbi se navodi da su OpenAI i Meta pokupili knjige zaštićene autorskim pravima s piratskih web stranica kako bi trenirali svoje AI modele. Ovo je ekvivalent modelu umjetne inteligencije koji preuzima svoje skupove podataka za obuku s Piratebaya bez naknade autorima.
Slučajno, a zasebna grupna tužba [PDF] protiv OpenAI-ja tvrdi da je tvrtka koristila neovlaštene privatne podatke za obuku ChatGPT-a. Google se također suočava sa sličnom tužbom zbog navodnog korištenja ukradenih podataka za treniranje Google Barda. Ovo je razlog zašto biste trebali stvorite naviku štititi svoje osobne podatke, iako izdavački rad i privatni osobni podaci nisu isto.
Kakve su šanse da Sarah Silverman dobije tužbu?
Silverman i drugi umjetnici tvrde da ChatGPT može točno sažeti njihove knjige kada se od njih zatraži. U žalbi se tvrdi da to ne bi bilo moguće da AI model nema pristup materijalu zaštićenom autorskim pravima. Međutim, ako je ChatGPT obučen pomoću milijardi internetskih tekstova, vjerojatno je naišao na članke, komentare i objave na društvenim mrežama u kojima se raspravlja o knjigama.
Nadalje, Meta je otkrila gdje je nabavila knjige koje je koristila za treniranje svog modela umjetne inteligencije - izvor je pronađen na torrent web stranici za e-knjige. Slično tome, kolektivna tužba protiv OpenAI-ja također spominje ilegalne web stranice za koje se sumnja da je OpenAI došao do materijala zaštićenih autorskim pravima, ali OpenAI tek treba potvrditi svoje izvore.
Ako se dokaže da su OpenAI i Meta koristili ilegalne torrent web stranice za nabavu materijala zaštićenih autorskim pravima za treniranje svojih AI modela, Silverman bi mogao dobiti tužbu. Međutim, modeli AI neistraženo su područje bez presedana na koji bi se sudovi mogli osloniti pri donošenju presude na temelju kršenja autorskih prava AI. Zapravo, to je jedan od razloga zašto EU je predložila Zakon o umjetnoj inteligenciji.
Kakva je budućnost AI modela i zakona o autorskim pravima?
Još smo u ranim danima AI da znamo kako će se prilagoditi zakonu o autorskim pravima. Još je složenije pokušavati shvatiti koji posjeduje autorska prava na stvaranje umjetne inteligencije. Ali za ljudske kreatore postoje propisi koji ih štite od pristupa nekome drugom njihovom materijalu zaštićenom autorskim pravima bez naknade, pristanka ili priznanja. Ako pravila postoje za ljude, hoće li se primjenjivati na AI modele?
Europski parlament napravio je nacrt najbližeg uvida u budućnost kako će AI modeli biti u skladu sa zakonom o autorskim pravima. Ako EU AI Act postane zakon, AI modeli poput ChatGPT-a i Barda morat će objaviti sve svoje izvore skupova podataka i podatke zaštićene autorskim pravima koji se koriste za obuku. To će pomoći da se razjasni svaka zabuna ako su AI modeli pristupali knjigama, filmovima, glazbi i fotografijama zaštićenim autorskim pravima za obuku putem ilegalnih piratskih web stranica.
Odluka o tužbi AI-ja o zajedničkoj tužbi postavit će pravni presedan
Veliki jezični modeli mogu pretražiti sve kutove interneta u potrazi za podacima koji se koriste u obuci. No, hoće li biti odgovorni za kršenje autorskih prava ako pristupe ilegalnim torrent web stranicama kako bi pribavili podatke? A ako jesu, možete li to dokazati?
Bez obzira na ishod, kolektivne tužbe protiv tehnoloških tvrtki koje posjeduju najpopularnije AI modele postavit će presedan koji će biti relevantan u budućnosti.