Oglas
Nedavno sam radio na priči koja je uključivala osobu koja je telefonirala, a koja je bila snimljena. Ta je osoba kasnije odbila priznati da je uopće ikada pozvala.
S snimljenim glasom iz telefonskog poziva i isječkom osobe koja negira optužbu, počeo sam raditi pokušavajući pronaći način da dokažem da su glasovi bili jedan te isti.
Priznajem da sam pomalo opsjednuta glasovnim tehnologijama. To je razlog zašto sam čekao Google Voice Kako koristiti Google Voice za blog putem telefona Čitaj više postati napredniji sa svojom tehnologijom prepoznavanja glasa i zato volim aplikacije za kontrolu glasa na računalu poput Taztija Omogući kontrolu govora u tekst i glas putem postavljanja prepoznavanja govora u sustavu WindowsPrepoznavanje govora i dalje je moćnije od Cortane. Pokreće govor na kontrolu teksta i glasa. Ovaj će vam članak pokazati što prepoznavanje govora može učiniti, kako ga postaviti, osposobiti i koristiti. Čitaj više . Međutim, kad je u pitanju digitalno uspoređivanje glasova, bio sam na gubitku. Vjerojatno ste vidjeli one špijunske filmove u kojima računalo može automatski prepoznati glas poznatog kriminalca samo s tiskom glasa.
Da budem iskren, jednom kada sam otkrio Sonogram Visible Speech, shvatio sam da je glasovna tehnologija spektrograma zapravo je trenutno izvediv način da čvrsto identificirate osobu samo njihovim glasom.
Razumijevanje spektrograma
Ako znate za kemijske izotope, onda znate da s izotopima kemičari mogu prepoznati kemijsku strukturu spojeve izoliranjem osnovnih elemenata i korištenjem raščlambe da se identificiraju pojedinačne komponente bilo koje smjesa. Na gotovo isti način, audio spektrogram razgrađuje zvuk na osnovne frekvencije. Zanimljivost ljudskog glasa je što nitko ne govori jednom frekvencijom. Vaša usta, nosni prolazi i struktura vašeg govornog okvira određuju mješavinu frekvencija koje čine vaš pomalo jedinstven glas.
Sonogram Visible Speech besplatna je aplikacija spektrograma koja će uzimati video ili audio datoteke i lomiti se dolje audiozapis u cijeli spektar - sve njegove frekvencije kroz čitav vremenski okvir staza. Ispunjeni spektrogram izgleda kao na slici ispod.

Kao što vidite, dno zapisa izgleda kao osnovni zvučni val koji ćete vidjeti u programu Smjelost 3 savjeta za hrabrost kako biste poboljšali svoje snimljene intervjueJasni zvuk je od vitalnog značaja za bilo koji podcast ili snimanje koje želite objaviti. Povećajte kvalitetu zvuka pomoću Audacityja u tri jednostavna koraka. Čitaj više Međutim, središnje okno prikazuje svaki segment zvučne datoteke u čitavom rasporedu frekvencija. Iznenađujuća stvar ovog softvera je da postoje mnoge druge valne oblike koje možete koristiti za ispitivanje vaše zvučne datoteke. To su posebno za napredne korisnike.

Možete konfigurirati način prikazivanja svakog od tih oblika vala ulaskom u izbornik "Opcije" i odabirom "Općenito Podešavanje." Ovdje možete definirati kako logaritamski grafikoni izračunavaju izlaz i opću postavku zaslona za sve dostupne ljestvice.

Ako je zvuk prilično tih ili je glas koji analizirate šapat, možda biste trebali razmisliti o upotrebi logaritamskog prikaza frekvencije. Omogućujete ga u izborniku "Opcije" i odaberite "Logaritamska frekvencija." To će donekle "povećati" značajna područja frekvencije u spektrogramu.

Ovo zaista može pomoći u prepoznavanju jasnih obrazaca frekvencije koji prepoznaju nekoga po zvuku njihovog glasa. Ako ste potpuno izgubljeni i ne znate odakle započeti, klikom na "Pomoć" i "Internetska pomoć" otvorit će se vrlo dobro napisani priručnik za pomoć u vezi s Sonogramom. Ovo je sjajno mjesto za početak ako ste novi u audio analizama spektrograma.

Eksperiment sa spektrogramima korištenjem lova na duhove
Ljepota ovog softvera je u tome što je dobar za mnogo različitih korištenja. Jedan od artefakata koji se često pojavljuje u lovu na duhove, moj je osobni interes "Fenomen elektroničkog glasa" - gdje se glas ukazanja ili duha navodno pojavljuje na zvuku snimke. Te su snimke raštrkane po webu, pa sam odlučio povući nekoliko web stranica lovaca na duhove i napraviti analizu spektrograma.

Spektrogram pokazuje da su frekvencije glasa uglavnom niske, ali da biste dobili bolju sliku glasova u snimku, morate otvoriti dodatne valne oblike. Automatski korelacijski prikaz izračunava "visinu" u vremenskom okviru u kojem držite miš.

"Duh" ima prosječnu frekvenciju tona od oko 129,0 hz. Pomičite se do kraja snimke gdje čujete istražiteljev glas, izračunati glas frekvencija je oko 208,0 hz (što ima smisla jer je ženski glas i zvukovi koji snimaju duha muški.)

Otvaranje zaslona Fast Fourier otkriva još više detalja o glasovima. Ovaj grafikon brzo raščlanjuje primarne frekvencije i prikazuje ih u kodu u boji.

U ovom se slučaju raspodjela frekvencija širi na više dijelova, s nekim visokim, ali i dobrim brojem niskih frekvencija u miksu. Međutim, istražitelj u sobi jasno govori glasom koji je učestalo skupljen prema najvišem kraju raspona, kao što je prikazano ovdje.

Ova je brza analiza dokazala da su dva glasa prilično različita, ali ovo je samo osnovni primjer sposobnosti ovog moćnog softvera. U osnovi, svaka situacija u kojoj prekid frekvencija zvučnog vala može pomoći - ovo je softver za vas. To je lako naučiti, brzo postaviti i konfigurirati, a radi jednako dobro ili bolje od bilo kojeg softvera s plaćenim spektrogramom na tržištu.
Imate li neke projekte koji bi mogli koristiti spektrogram? Jeste li ikad probali Sonogram vidljivi govor? Podijelite svoj uvid u odjeljku s komentarima u nastavku.
Ryan je diplomirao elektrotehniku. Radio je 13 godina u inženjerstvu automatizacije, 5 godina u IT-u, a sada je Apps inženjer. Bivši glavni urednik MakeUseOfa, govorio je na nacionalnim konferencijama o vizualizaciji podataka i bio je prikazan na nacionalnoj televiziji i radiju.