Oglas
ì´ ì›¹ì‚¬ì´íŠ¸ì— 환ì˜. ì´ê²ƒì€ 보기 ì›ë³¸ì´ë‹¤
Koji je ovo jezik? Kineski? Japanski?
Zapravo je korejski. Ručno otkrivanje ovoga oduzelo bi mi puno vremena. Srećom, pronašao sam neke vrlo točne alate koji to mogu učiniti automatski. Svi su navedeni u nastavku.
Eksperiment, pokus: Testirao sam web stranice koristeći uzorak teksta (1-2 rečenice s 8 riječi) iz sljedećih jezika: portugalski, ruski, korejski, vijetnamski, talijanski, turski, poljski, ukrajinski, azerbejdžanski, slovenski, makedonski, nizozemski, filipinski (tagalog), grčki, galicijski, češki, bjeloruski, finski, tatarski i norveški.
Sveukupno sam testirao 20 različitih jezika.
3 Alati za otkrivanje teksta na nepoznatom jeziku
1. LangId (položio 18 od 20 testova, nije položio tatarski i bjeloruski)
Prednosti: Općenito, odličan online alat. Nudi osnovnu funkciju otkrivanja teksta i oni također imaju Cvrkut i botovi za otkrivanje e-pošte za još brže rezultate.
Protiv: Njihov se motor temelji na Google API-ju, ali čini se da imaju bolje rezultate od Google detektora opisanog u nastavku. Čini se da znaju jako dobro iskoristiti stvari. Nije mi se svidjelo što nemaju svoj jedinstveni algoritam za otkrivanje jezika.
2. Google Detektor jezika [više nije dostupan] (položio 17 od 20 testova, nije položio portugalski, taglog i bjeloruski)
Prednosti: Google ima jedan od najboljih svjetskih API-ja za otkrivanje jezika. Dobra stvar je što možete vidjeti vjerojatnost da je rezultat koji prikazuju istinit. Uspjeli su proći većinu testova uzorka.
Protiv: Bio sam prilično iznenađen što nisu prošli ispit iz portugalskog. Čini se da imaju (nadam se privremenu) grešku s ovim jezikom. Također, oni sigurno mogu napraviti bolji posao u poboljšanju dizajna stranice.
3. Koji je ovo jezik (položio 11 od 20 testova, nije položio ruski, korejski, ukrajinski, azerbejdžanski, makedonski, tagaloški, grčki, galicijski i tatarski)
Prednosti: Neki jezici poput južnoslavenskih (srpski, hrvatski, slovenski) dosta su slični. U slučaju da unesete neki hrvatski tekst, recimo, ova stranica će vam reći da bi tekst mogao biti i srpski ili slovenski.
Protiv: Moraju raditi na tome da svoj sustav detekcije učine sofisticiranijim. Mislio sam staviti Prevedeno.net (još jedna web stranica za otkrivanje jezika) umjesto ove, ali Translated je obećao otkrivanje više jezika i zapravo je bio lošiji od WhatLanguageIsThis.com.
2 Alati za otkrivanje web stranica na nepoznatim jezicima
4. Google prevoditelj s Prepoznaj jezik kao prva opcija
Prošao: 18 od 20, nije prošlo bjeloruski i tatarski.
Prednosti: Ovaj alat vrlo dobro radi svoj posao. Ono što mi se sviđa Google prevoditelj Google Translate 2.1 prikazuje se s izvornom tipkovnicom za iOS 7 i više jezične podrškeAžurirajte na Google Translate 2.1 na svom iOS uređaju i nosite podršku za prijevod i podršku za unos rukopisa za nove jezike. Google Translate konačno dobiva novu tipkovnicu za iOS 7 za sve... Čitaj više je da ako ne podržava određeni jezik, daje vam sljedeći zaslon:
To je izvrstan detektor jezika ako mene pitate!
5. Microsoft Bing prevoditelj s Automatsko otkrivanje kao prva opcija.
Prošao: 8 od 20, nije prošlo nizozemski, vijetnamski, turski, ukrajinski, azerbejdžanski, slovenski, makedonski, tagaloški, grčki, galicijski, češki i bjeloruski
Prednosti: Podržava ograničen broj jezika. Za te jezike dobro radi svoj posao.
Protiv: Jako sam razočaran Microsoftom. Imaju vrlo ograničen broj jezika za otkrivanje i prijevod Zaboravite Google prevoditelj: 3 načina da dobijete točan, brz prijevodBilo da se planirate prijaviti za posao ili stan u inozemstvu, ili želite prevesti svoju web stranicu, morate ispraviti stvari čak i sa stranim jezikom. Čitaj više a njihova značajka automatskog otkrivanja je užasna. U slučaju da unesete jezik koji oni ne podržavaju, dobit ćete pogrešan rezultat umjesto da vam kažu da ne podržavaju taj jezik.
Misli
Općenito, moje je mišljenje da gore navedeni alati idu u dobrom smjeru. Trenutno su najbolji za otkrivanje jezika na mreži i prilično dobro rade svoj posao kada su popularni jezici u pitanju. Međutim, moraju raditi na dodavanju još nejasnih jezika (ni jedan od alata nije uspio prepoznati tatarski) i siguran sam da će svi, a posebno Google, ići u tom smjeru u bliskoj budućnosti.
Kredit za sliku: Kanko*
Moje ime je Darko (nadimak Darren.) Sviđa mi se Web 2.0, kreiranje nišnih web stranica (moj najnoviji projekt je pretraživanje ljudi) i tako dalje...što drugo reći o sebi na ovako kratkom profilu, zapratite moj na Twitteru ako želite saznati više :)