Google je objavio svoj Lyra audio codec beta izvorni kôd na GitHubu, čineći obradu zvuka nevjerojatne kvalitete s malim brzinama prijenosa dostupnom svim programerima. Kodek je najkorisniji u situacijama s ugrađenom i ograničenom širinom pojasa kada je potrebno spremiti što više podataka.

Lyra: Gotovo ništa nikad nije zvučalo tako dobro

Zvučni kodek radi na principu pružanja što prirodnijeg zvuka s najnižom mogućom brzinom prijenosa podataka. Uspijeva stvoriti gotovo jezive razine reprodukcije zvuka s bitrateom od samo 3 kbps. Google koristi kompresiju Lyra u stvarnom vremenu već u svojoj aplikaciji Duo, premda vas ne bi krivili što niste ni shvatili razliku od uobičajenog propusnog opsega zvuka.

Da bi pokazao koliko je Lyra bolja od ostalih kodeka, Google pruža primjere putem a post na blogu uspoređujući kompresijski kodek vođen strojnim učenjem s ostalim alternativama od 3 i 6 kbps.

Razlika je u noći i danu, a pružanje programerima svijeta preko ovih alata bit će značajan pokretač u poboljšanju kvalitete komunikacije tamo gdje je širina pojasa široka. Također je izvrstan motivator za programere koji žele stvoriti nove aplikacije na tržištima u razvoju, nešto što će Google zasigurno pokriti u ovogodišnjim

instagram viewer
besplatna virtualna Google I / O mrežna konferencija.

Beta izvorni kod trenutno je dizajniran s 64-bitnim Arm uređajima, iako će se primjeri izvoditi i na 64-bitnim x86 Linux sustavima. Izvorni kod pruža se u potpunosti dokumentiran, premda je u beta verziji, a stranica GitHub sadrži upute za instalaciju i kako izgraditi Lyru na Linuxu za 64-bitne ciljeve Arm.

Da biste dobili izvorni kod Lyra beta, idite na Stranica Lyra GitHub.

Kako Lyra radi?

Iako je stvarni postupak koji Lyra koristi nevjerojatno složena kombinacija modela strojnog učenja na kojima se vježba tisuće sati govornih podataka i optimizacija postojeće tehnologije audio kodeka, teorija je sasvim mirna jednostavan.

Svakih 40 ms značajke se preuzimaju iz govora i komprimiraju na 3 kbps. Te značajke predstavljaju govorne energetske točke u frekvencijskom spektru najbliže ljudskom slušnom govornom odgovoru - stvari koje moramo prepoznati i razumjeti kad netko govori.

Ključni dio onoga što Lyru čini posebnom jest kako koristi ove podatke:

Međutim tradicionalni parametarski kodeci, koji iz govora jednostavno izdvajaju kritične parametre koji tada mogu biti koristi se za ponovno stvaranje signala na prijemnom kraju, postizanje niskih brzina prijenosa, ali često zvuči robotski i neprirodno. Ovi nedostaci doveli su do razvoja nove generacije visokokvalitetnih audio generativnih modela koji jesu revolucionirao je polje time što je mogao ne samo razlikovati signale, već i generirati potpuno nove one.

Nakon prijenosa, Lyra obnavlja valni oblik popunjavajući ono što nedostaje pomoću ovog postupka, iako nekako nije previše računski složena.

S jedne strane, to je tehnološko čudo koje će se odvijati gotovo bilo gdje. S druge strane, još uvijek nisam 100% uvjeren da to nije vračanje.

E-mail
10 značajki Google Duoa koje biste doista trebali koristiti

Google Duo jedna je od najboljih aplikacija za video pozive. Ima puno značajki, a evo i onih za koje mislimo da biste ih stvarno trebali koristiti.

Pročitajte Dalje

Povezane teme
  • Tehničke vijesti
  • Google
  • Android
  • Strojno učenje
O autoru
Ian Buckley (Objavljeno 209 članaka)

Ian Buckley slobodni je novinar, glazbenik, izvođač i video producent koji živi u Berlinu u Njemačkoj. Kad ne piše ili je na sceni, petlja se s DIY elektronikom ili kodom u nadi da će postati ludi znanstvenik.

Više od Iana Buckleyja

Pretplatite se na naše obavijesti

Pridružite se našem biltenu za tehničke savjete, recenzije, besplatne e-knjige i ekskluzivne ponude!

Još jedan korak…!

Potvrdite svoju e-adresu u e-pošti koju smo vam upravo poslali.

.