Oglas

Ako želite bilo koji tiskani tekst pretvoriti u digitalni tekst koji možete kopirati, zalijepiti, urediti i pretraživati, morat ćete upotrijebiti skenere za optičko prepoznavanje znakova (OCR).

Kada odlučite skenirati ili fotografirati dokument, to će se spremiti u formatu poput JPEG ili PDF. OCR softver može prepoznati slova i brojeve unutar tih dokumenata i pretvoriti ih u a pretraživački PDF 4 načina za kreiranje i uređivanje PDF datoteka besplatnoOd svih uobičajenih vrsta datoteka koje se nalaze u našem računalnom svijetu, PDF je vjerojatno jedan od naj restriktivnijih, a istovremeno je dostupan svima za korištenje (prvenstveno za čitanje) ... Čitaj više ili u datoteku koju možete uređivati ​​u programima kao što je Microsoft Word.

Problem je u tome što neki OCR skeneri rade puno bolje nego drugi, a najbolji su prilično teški na novčaniku.

Omnipage18, primjerice, košta 150 dolara, ali posebno je dobar u prepoznavanju različitih jezika. Adobe Acrobat Pro DC košta oko 400 dolara, ali ima nevjerojatnu točnost.

instagram viewer
ABBYY FineReader košta 150 dolara, ali fantastično je pretvoriti dokumente poput časopisa i brošura u tekst koji se može pretraživati. Kasnije ćemo u ovom članku testirati ABBYY on-line ponudu.

Međutim, ako tražite besplatne alternative, možete preuzimanje datoteka i koristiti na Windows ili OS X, trebali isprobajte ove OCR alate 5 najboljih OCR alata za izdvajanje teksta sa slikaKada imate ostatke papira, kako možete sav taj tiskani tekst pretvoriti u nešto što će digitalni program moći prepoznati i indeksirati? Držite dobar softver za OCR u blizini. Čitaj više . Ali ako biste radije koristili besplatni, na liniji OCR alat, nastavite čitati, kao što smo isprobali u prvih nekoliko, s donjim rezultatima.

Ispit

Čini se da većina ljudi sada koristi svoje pametne telefone kako bi izvršili skeniranje za njih Skenirajte i upravljajte svojim primanjima, štedite prostor, papir i vrijemePrimanja od papira lako se gube i teško ih je pronaći kada su vam najpotrebnija. Srećom, digitalna tehnologija rješava oba ova problema. Čitaj više , Odlučio sam iskoristiti Aplikacija Evernote za skeniranje (Besplatno za iOS i Android). Pregledao sam prvu stranicu Richarda Dawkina Uspon na planinu nemoguć, da vidimo kakve smo rezultate mogli dobiti s vrlo osnovnim oblikovanjem. Također sam skenirao stranicu Tima Ferrissa Kuhar u 4 sata isprobati skenere s nekim malo složenijim oblikovanjem. Svaku od tih datoteka spremio sam kao PDF.

Testiranje mrežnih OCR-a

Ti su dokumenti zatim prolazili kroz neke od navodno najboljih internetskih OCR alata kako bi se vidjelo koliko su dobre.

Besplatni online OCR [Nema više dostupnih]

Srećom, nije potrebna registracija za upotrebu besplatnog mrežnog OCR-a. I bio sam dvostruko impresioniran kad sam vidio njihovu tvrdnju da zadržavaju oblikovanje i izgled svog dokumenta.

Besplatno internetsko OCR

Web mjesto tvrdi da može podržati PDF, GIF, BMP, JPEG, TIFF i PNG kao ulaz. Izlazi mogu biti DOC, PDF tekstualni dokument, RTF i TXT. Nažalost, nisam mogao otkriti imaju li ograničenje veličine datoteke.

Osnovni dokument u PDF
Pretvoreno apsolutno savršeno. Nema se puno više za reći! Idemo na vrlo dobar početak.

Osnovni dokument DOC-u
Čini se da su se stvarne riječi besprijekorno pretvorile, osim što je „unnt“ s „Mount Rushmore“ nekako išao AWOL. Međutim, oblikovanje je drugačija priča. Mnogo zareza zamijenjeno je podvlakama, a slučajni razmaci umetnuti su u točke kroz dokument. Kad kasnije vidite kako se premium test održao u ovom testu, to nije loš napor uopće.

Složeni dokument u PDF
Pretvaranje dokumenta trajalo je vrtoglavih 120 sekundi! Nakon dovršetka, sav je tekst pretvoren s oko 95% točnosti, premda je tekst u zasebnom okviru u gornjem desnom kutu stranice bio nepouzdan. Nekoliko drugih znakova u PDF-u također je bilo netočno.

Složeni dokument DOC-u
Ovoga puta pretvorba je trajala samo 10 sekundi, a tekst se opet pretvarao s oko 95% točnosti. Bilo je nekih čudnih problema s razmakom, a softver je imao problema s konvertiranjem fonta u gornjem desnom kutu dokumenta i propustio je nekoliko znakova tu i tamo.

Presuda
Ako želite pretvoriti dokumente jednostavno formatirane u PDF, ovo je fantastičan alat. U smislu pretvaranja u DOC, rezultati nisu imali o čemu pisati kući.

i2OCR iznosi impresivne tvrdnje. Alat prepoznaje preko 60 jezika, može obraditi izgled više stupaca (uklanjanjem oblikovanja), nema ograničenja veličine datoteke, može pretvoriti prenesene datoteke i s URL-ova. A ni ovaj se alat ne trebate registrirati za upotrebu ovog alata.

Usluga funkcionira tako da jednostavno ekstrahira tekst sa vaše slike, a zatim reproducira neformatirani tekst. Bilo kakve pogreške u bočnom prikazu možete brzo ispraviti prije kopiranja teksta u druge programe ili preuzimanja kao DOC, PDF ili HTML.

Napomena: kad sam pokušao prenijeti svoje PDF dokumente, i2OCR ih je odbio, pa sam ih morao pretvoriti u JPEG (snimanjem snimke zaslona i prijenosom datoteka).

Osnovni dokument za običan tekstSnimka zaslona 2016-02-11 u 12.30.28
Zbog načina rada ovog alata gubi se svako oblikovanje, premda je pretvorba iz slike u tekst bila gotovo savršena. Bilo je malih pogrešaka poput razmaka odlomka, a neke su zarezne točke zamijenjene razdobljima, ali to su mali nigglesi.

Složeni dokument za običan tekstSnimka zaslona 2016-02-11 u 12.39.48
Većina teksta pretvorena je bez previše pogrešaka, osim naslova i recepta u gornjem desnom kutu, što je za ovaj alat bilo nečitljivo. Način pretvaranja stupaca u običan tekst bio je daleko od idealnog. Ako želite ovu pretvorbu učiniti izvodljivom, trebalo bi puno vremena da se redovi preurede u koherentne rečenice.

Presuda
Za osnovne dokumente i2OCR odlično funkcionira. Mogućnost uređivanja teksta prije preuzimanja također je vrlo lijep dodir. Za složenije dokumente, pretvaranje je još uvijek prilično točno, ali način na koji se tekst ispiše neće vam olakšati život.

Online OCR trenutno podržava 46 različitih jezika i može pretvoriti PDF, JPG, BMP, TIFF i GIF u Word, Excel ili Plain Text format. Web mjesto tvrdi da "pretvoreni dokumenti izgledaju točno kao izvorni - tablice, stupci i grafike".

Verzija koju možete koristiti bez registracije omogućuje vam pretvaranje do 15 slika na sat (ograničenje od 5MB). Ako se prijavite za račun, iznad ovog ograničenja možete kupiti više stranica, a istovremeno možete i pretvoriti dokumente s više stranica i ZIP arhive.

Internetski rezultati OCR-a

Osnovni dokument DOC-u
Osnovni dokument besprijekorno se pretvarao osim rimske brojke ja ne bude pokupljen. Kao što je stranica obećala, oblikovanje je bilo točno onako kako je bilo u knjizi. Kudo na ovaj alat.

Složeni dokument DOC-u
Nakon što sam razočaran prethodnim OCR alatima u pretvorbi složenog dokumenta, bio sam masivno impresioniran Online OCR-om. Izgled je bio gotovo savršen, kao što vidite gore. Još jednom, recept se nije pokupio previše dobro, ali bilo koje druge manje pogreške bile su zanemarive.

Presuda

Apsolutno fantastični rezultati od Online OCR. Jedini nedostatak koji vidim je ne postoji način za preuzimanje pretvorenih dokumenata u PDF-ove, jer navedeni izlazni formati uključuju samo DOCX, XLSX i TXT.

Kao što je spomenuto ranije, ABBYY je jedan od vodećih proizvođača softvera za OCR koji košta njihov oko 150 USD za kompletan program za preuzimanje. Oni nude Besplatno probno razdoblje od 10 stranica za njihov mrežni alat (potrebna je registracija). Za pretplatu od 5 USD njihov će internetski alat omogućiti konverziju 200 stranica svaki mjesec.

ABBYY FineReader Online

Prihvaćene datoteke mogu biti do 100Mb, u bilo kojem od ovih formata: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP i PNG. ABBYY također prepoznaje gotovo 200 jezika. Rezultati su posebno impresivni, s izborom između DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 i EPUB.

Možete čak isprobati i nekoliko BETA značajki tijekom suđenja. Prva je mogućnost prevođenja vašeg dokumenta na drugi jezik. Drugi je izvoz konvertiranog dokumenta u vaš račun za pohranu u oblaku, bilo da je to Dropbox, Google Drive, Evernote, Microsoft OneDrive ili Box.

Osnovni dokument u DOCX
Ukupni rezultati bili su dobri, ali ne zadivljujući obzirom da je ovo premium proizvod. Više zareza i razdoblja zamijenjeno je okolo, nekoliko obrnutih zareza zamijenjeno je zvjezdicom, nedostajalo je nekoliko velikih slova, a jedna riječ (doslovno) napisana je pogrešno.

Složeni dokument u DOCX
Nakon pretvaranja u tekstu dokumenta bilo je vrlo malo pogrešaka (osim što se OCR opet bori s fontom tog recepta!), Ali oblikovanje je ostalo puno željenog.

ABBYY Rezultat

Tri su stupca nekako zauzimala dvije stranice, sa središnjim stupcem samo pojavljuju se na drugoj stranici. Ako zapravo želite čini bilo što s ovim pretvorenim dokumentom, na kraju biste povukli kosu.

Osnovni dokument u PDF
Pregledavši pretvoreni PDF, uopće nisam mogao pronaći nikakvu grešku. Možda smo pronašli mjesto u kojem se ABBYY ističe. Fantastični rezultati.

Složeni dokument u PDF
Opet nisam mogao pronaći nikakve pogreške u ovoj pretvorenoj datoteci. ABBYY očito izuzetno dobro pretvara u PDF.

Presuda
Ako rado plaćate nekoliko dolara, čini se da pretvaranje u PDF dokument funkcionira fenomenalno dobro s ovom uslugom i funkcioniranjem mogućnost sinkronizacije pretvorenih datoteka u vašu pohranu u oblaku posebno je korisna ako skenirate veliku količinu dokumenti. Kao i kod ostalih opcija, ABBYY još uvijek nije smislio kako besprijekorno pretvoriti dokumente u DOC radi jednostavnog uređivanja.

Konačni ishod

Ako, kao i većina ljudi, samo želite skenirati nekoliko članaka iz časopisa i neke račune za kućanstvo, nećete trebati uređivati ​​te dokumente. Stoga će vam izravno pretvaranje u PDF biti prikladno jer ćete i dalje moći pretraživati ​​te dokumente. Za to je Free Online OCR definitivno bio najbolji besplatni alat koji smo testirali. To se kaže, ako ste spremni platiti 5 USD mjesečno za gotovo savršenstvo, ABBYY's FineReader Online bio je malo precizniji.

Kada je riječ o pretvaranju dokumenata u DOC, nismo uspjeli pronaći nijedno rješenje koje je bilo savršeno, ali daleko su najbolji rezultati došli Online OCR. Pretvorba nije bila savršena, ali integritet oblikovanja uglavnom je ostao netaknut, a pogreške su zanemarive. Usporedimo li ove rezultate s „premium“ ponudom tvrtke ABBYY, ne možete si impresionirati.

Nismo uključili OCR mogućnosti Google diska u ovom postu; malo za Googleovu svugdje, ali više za činjenicu da smo htjeli testirati nekoliko drugih besplatnih mrežnih OCR usluga vani.

Za vas: Koje druge internetske OCR alate biste preporučili našim čitateljima? A što ste pokušali da više nikad ne upotrebljavate?

Rob Nightingale je diplomirao filozofiju na Sveučilištu York, Velika Britanija. Radio je kao menadžer i savjetnik za društvene medije više od pet godina, održavajući radionice u nekoliko zemalja. Posljednje dvije godine Rob je bio i tehnološki pisac te je MakeUseOfov menadžer za društvene medije i urednik biltena. Obično ćete ga naći na putovanju...