4 eines OCR en línia gratuïtes posades a prova final

4 eines OCR en línia gratuïtes posades a prova final

Si voleu convertir qualsevol text imprès en text digital que pugueu copiar, enganxar, editar i cercar, haureu d’utilitzar escàners de reconeixement òptic de caràcters (OCR).





Quan escolliu escanejar o fer una foto d'un document, es desarà en un format com JPEG o PDF. Programari OCR llavors pot reconèixer les lletres i els números d’aquests documents i convertir-los en un PDF que es pot cercar o en un fitxer que podeu editar en programes com Microsoft Word.





El problema és que alguns escàners OCR funcionen molt millor que d’altres, ja que els millors són força pesats a la cartera.





Omnipage18, per exemple, costa 150 dòlars, però és especialment bo per reconèixer diferents idiomes. Adobe Acrobat Pro DC costa uns 400 dòlars impressionants, però té una precisió increïble. ABBYY FineReader costa 150 dòlars, però és fantàstic convertir documents com revistes i fulletons en text que es pot cercar. Provarem l'oferta en línia d'ABBYY més endavant en aquest article.

Tanmateix, si busqueu alternatives gratuïtes, podeu descarregar i utilitzar-lo a Windows o OS X, heu de provar aquestes eines OCR. Però si preferiu utilitzar una versió gratuïta, en línia Eina OCR, seguiu llegint, ja que hem provat els primers, amb els resultats a continuació.



La prova

Sembla que la majoria de la gent fa servir els seus telèfons intel·ligents per escanejar-los, vaig decidir utilitzar-los L'aplicació escanejable d'Evernote (Gratuït a iOS i Android). Vaig escanejar la primera pàgina de Richard Dawkin Escalada muntanya improbable , per veure quins resultats podríem obtenir amb un format molt bàsic. També vaig escanejar una pàgina de Tim Ferriss ' El xef de 4 hores per provar els escàners amb un format lleugerament més complicat. He desat cadascun d’aquests fitxers en format PDF.

Aquests documents es van executar a continuació a través d'algunes de les suposades millors eines de OCR en línia per veure el bon rendiment que tenien.





OCR en línia gratuït [Ja no està disponible]

Afortunadament, no cal registrar-se per utilitzar OCR en línia gratuït. I em va quedar doblement impressionat quan vaig veure la seva afirmació de mantenir el format i el disseny del meu document.

El lloc afirma ser compatible amb PDF, GIF, BMP, JPEG, TIFF i PNG com a entrada. Les sortides poden ser DOC, un document de text PDF, RTF i TXT. Malauradament, no he pogut esbrinar si tenien un límit de mida de fitxer.





Document bàsic a PDF

Convertit perfectament. No hi ha molt més a dir! Anem a un molt bon començament.

Document bàsic a DOC

Les paraules reals semblen haver-se convertit impecablement, a part del 'ount' de 'Mount Rushmore' que d'alguna manera passa a ser AWOL. El format és, però, una història diferent. Moltes comes es van substituir per subratllats i es van inserir espais aleatoris en punts del document. No obstant això, quan més endavant vegeu com va funcionar el programari premium en aquesta prova, no és un mal esforç en absolut .

Document complex a PDF

Document complex a DOC

Aquesta vegada, la conversió només va trigar deu segons, i el text es va tornar a convertir amb una precisió aproximada del 95%. Hi va haver alguns estranys problemes d’espaiat i el programari va tenir problemes per convertir el tipus de lletra a la part superior dreta del document i va perdre alguns caràcters aquí i allà.

Veredicte

i2OCR

i2OCR fa algunes afirmacions impressionants. L'eina reconeix més de 60 idiomes, pot gestionar dissenys de diverses columnes (eliminant el format), no té límits de mida de fitxer, pot convertir fitxers penjats i a partir d’URL. I tampoc no cal registrar-se per utilitzar aquesta eina.

El servei funciona simplement extraient el text de la vostra imatge i, a continuació, envia text sense format. Podeu corregir ràpidament qualsevol error a la vista de costat a costat, abans de copiar el text a altres programes o descarregar-lo com a DOC, PDF o HTML.

Nota: quan intentava penjar els meus documents PDF, i2OCR els va rebutjar, de manera que calia convertir-los a JPEG (prenent-ne una captura de pantalla i després carregant els fitxers).

Document bàsic per a text pla

Document complex a text pla

La majoria del text es va convertir sense massa errors, a part del títol i la recepta de la part superior dreta, que no es podia llegir per a aquesta eina. La forma de convertir les columnes en text pla no era ni molt menys ideal. Si voleu fer possible aquesta conversió, caldria molt de temps per reordenar les línies en frases coherents.

Veredicte

OCR en línia

Actualment, l’OCR en línia admet 46 idiomes diferents i pot convertir PDF, JPG, BMP, TIFF i GIF a format Word, Excel o de text pla. El lloc afirma que 'els documents convertits semblen exactament l'original: taules, columnes i gràfics'.

La versió que podeu utilitzar sense registrar-vos permet convertir fins a 15 imatges per hora (límit de 5 MB). Si us inscriviu a un compte, podeu comprar més pàgines per sobre d’aquest límit, alhora que també podeu convertir documents de diverses pàgines i arxius ZIP.

Document bàsic a DOC

El document bàsic es va convertir perfectament a part del nombre romà Jo no ser recollit. Tal com va prometre el lloc, el format era exactament igual que al llibre. Felicitacions a aquesta eina.

Document complex a DOC

Després de decebre’m amb les eines anteriors d’OCR en convertir el document complex, em va impressionar enormement l’OCR en línia. El disseny era gairebé perfecte, com podeu veure més amunt. Una vegada més, però, la recepta no es va recollir massa bé, però qualsevol altre error menor va ser insignificant.

Veredicte

Resultats absolutament fantàstics amb OCR en línia. L'únic inconvenient que veig és que no hi ha manera de baixar els documents convertits en PDF, ja que els formats de sortida esmentats només inclouen DOCX, XLSX i TXT.

ABBYY FineReader en línia (prova de 10 pàgines)

Com es va esmentar anteriorment, ABBYY és un dels líders del mercat en programari OCR, amb un cost d’uns 150 dòlars pel seu programa complet i descarregable. Ofereixen un Prova gratuïta de 10 pàgines per a la seva eina en línia, però (cal fer el registre). Per a una subscripció de 5 dòlars, la seva eina en línia us permetrà convertir 200 pàgines cada mes.

Els fitxers acceptats poden tenir un màxim de 100 MB, en qualsevol d'aquests formats: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP i PNG. ABBYY també reconeix gairebé 200 idiomes. Les sortides són especialment impressionants, amb una opció entre DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 i EPUB.

Fins i tot podeu provar un parell de funcions BETA durant la prova. La primera és l'opció de traduir el document a un altre idioma. L'altre és exportar el document convertit al vostre compte d'emmagatzematge al núvol, ja sigui Dropbox, Google Drive, Evernote, Microsoft OneDrive o Box.

Document bàsic a DOCX

Document complex a DOCX

Un cop convertit, hi havia molt pocs errors al text dins del document (a part que l’OCR lluitava de nou amb el tipus de lletra d’aquesta recepta!), Però el format deixava molt a desitjar.

Les tres columnes d’alguna manera ocupaven dues pàgines, amb la columna central només que apareix a la segona pàgina. Si realment ho volguessis fer qualsevol cosa amb aquest document convertit, us acabaria estirant els cabells.

Document bàsic a PDF

Document complex a PDF

Veredicte

El resultat final

Si, com la majoria de la gent, només voleu escanejar alguns articles de revistes i algunes factures de la llar, no haureu d’editar aquests documents. Per tant, la conversió directa a PDF us serà adequada, ja que podreu cercar aquests documents. Per a això, OCR en línia gratuït va ser definitivament la millor eina gratuïta que vam provar. Dit això, si esteu disposat a pagar 5 dòlars al mes per gairebé la perfecció, FineReader en línia d’ABBYY era una mica més precís.

A l’hora de convertir documents a DOC, no hem aconseguit trobar cap solució que fos perfecta, però els millors resultats han estat de molt OCR en línia . La conversió no va ser perfecta, però la integritat del format es va mantenir intacta en gran part i els errors van ser insignificants. Quan comparem aquests resultats amb l’oferta “premium” d’ABBYY, no podeu deixar d’estar impressionat massivament.

No hem inclòs les funcions OCR de Google Drive en aquesta publicació; una mica per la globalitat de Google, però més pel fet que volíem provar alguns altres serveis gratuïts de OCR en línia.

Per a vosaltres: quines altres eines OCR en línia recomanaríeu als nostres lectors? I quin heu provat que no tornareu a utilitzar mai més?

Compartir Compartir Tweet Correu electrònic Una guia per a principiants d’animació de la parla

Animar la parla pot ser un repte. Si esteu preparat per començar a afegir diàlegs al vostre projecte, us desglossarem el procés.

com fer una captura de pantalla en una superfície
Llegiu a continuació Temes relacionats
  • Internet
  • Productivitat
  • Conversió de fitxers
  • OCR
Sobre l'autor Rob Nightingale(272 articles publicats)

Rob Nightingale és llicenciat en Filosofia per la Universitat de York, Regne Unit. Ha treballat com a gestor i consultor de xarxes socials durant més de cinc anys, mentre impartia tallers a diversos països. Durant els darrers dos anys, Rob també ha estat escriptor de tecnologia i és el gestor de xarxes socials de MakeUseOf i l’editor de butlletins. Normalment el trobareu viatjant pel món, aprenent l’edició de vídeos i experimentant amb la fotografia.

Més de Rob Nightingale

Subscriu-te al nostre butlletí

Uniu-vos al nostre butlletí per obtenir consells tècnics, ressenyes, llibres electrònics gratuïts i ofertes exclusives.

Feu clic aquí per subscriure-us