Advertentie

Als u gedrukte tekst wilt converteren naar digitale tekst die u kunt kopiëren, plakken, bewerken en zoeken, moet u OCR-scanners (Optical Character Recognition) gebruiken.

Wanneer u ervoor kiest om een ​​document te scannen of een foto te maken, wordt dit opgeslagen in een formaat zoals JPEG of PDF. OCR-software kan dan de letters en cijfers in deze documenten herkennen en ze omzetten in een doorzoekbare PDF 4 methoden om gratis PDF-bestanden te maken en te bewerkenVan alle veelvoorkomende bestandstypen in onze computerwereld is PDF waarschijnlijk een van de meest beperkende, terwijl het tegelijkertijd voor iedereen beschikbaar is om te gebruiken (voornamelijk om te lezen) ... Lees verder of in een bestand dat u kunt bewerken in programma's zoals Microsoft Word.

Het probleem is dat sommige OCR-scanners veel beter werken dan andere, waarbij het allerbeste behoorlijk zwaar is voor de portemonnee.

Omnipage18 kost bijvoorbeeld $ 150, maar is vooral goed in het herkennen van verschillende talen.

instagram viewer
Adobe Acrobat Pro DC kost een oogstrelende $ 400, maar heeft een ongelooflijke nauwkeurigheid. ABBYY FineReader kost $ 150, maar is fantastisch in het omzetten van documenten zoals tijdschriften en brochures in doorzoekbare tekst. We zullen het online aanbod van ABBYY later in dit artikel testen.

Als u echter op zoek bent naar gratis alternatieven die u kunt downloaden en gebruik op Windows of OS X, dat zou je moeten doen probeer deze OCR-tools De 5 beste OCR-tools voor het extraheren van tekst uit afbeeldingenAls je pakken papier hebt, hoe krijg je dan al die gedrukte tekst omgezet in iets dat een digitaal programma kan herkennen en indexeren? Houd een goede OCR-software in de buurt. Lees verder . Maar als je liever een gratis, online OCR-tool, blijf lezen, zoals we de top paar hebben uitgeprobeerd, met de onderstaande resultaten.

De test

Het lijkt erop dat de meeste mensen nu hun gebruiken smartphones om voor hen te scannen Scan en beheer uw bonnen, bespaar ruimte, papier en tijdPapieren bonnen gaan gemakkelijk verloren en zijn moeilijk te vinden wanneer u ze het meest nodig heeft. Gelukkig lost digitaal gaan beide problemen op. Lees verder , Besloot ik te gebruiken De scanbare app van Evernote (Gratis op iOS en Android). Ik heb de eerste pagina van die van Richard Dawkin gescand Beklimming onwaarschijnlijk, om te zien welke resultaten we zouden kunnen krijgen met een zeer eenvoudige opmaak. Ik heb ook een pagina van Tim Ferriss gescand ' De 4-uurs chef om de scanners uit te proberen met een iets ingewikkelder opmaak. Ik heb elk van deze bestanden als PDF opgeslagen.

Online OCR's testen

Deze documenten werden vervolgens door enkele van de zogenaamd beste online OCR-tools geleid om te zien hoe goed ze het deden.

Gratis online OCR [gratis beschikbaar]

Gelukkig is er geen registratie vereist om gratis online OCR te gebruiken. En ik was dubbel onder de indruk toen ik hun claim zag om de opmaak en lay-out van mijn document te behouden.

Gratis online OCR

De site claimt PDF, GIF, BMP, JPEG, TIFF en PNG als invoer te kunnen ondersteunen. Uitvoer kan DOC zijn, een PDF-tekstdocument, RTF en TXT. Helaas kon ik niet achterhalen of ze een maximale bestandsgrootte hadden.

Basisdocument naar PDF
Absoluut perfect geconverteerd. Er valt niet veel meer te zeggen! We gaan naar een heel goed begin.

Basisdocument naar DOC
De eigenlijke woorden lijken foutloos te zijn omgezet, afgezien van de "ount" van "Mount Rushmore" die op de een of andere manier AWOL wordt. De opmaak is echter een ander verhaal. Veel komma's zijn vervangen door onderstrepingstekens en willekeurige punten zijn in het hele document op punten geplaatst. Als je later ziet hoe de premiumsoftware het in deze test deed, is dit geen slechte poging helemaal niet.

Complex document naar PDF
Het converteren van het document kostte maar liefst 120 seconden! Na voltooiing was alle tekst geconverteerd met een nauwkeurigheid van ongeveer 95%, hoewel de tekst in het aparte vak rechtsboven op de pagina niet kon worden opgezocht. Een paar andere tekens in de pdf waren ook onjuist.

Complex document naar DOC
Deze keer duurde de conversie slechts 10 seconden, waarbij de tekst opnieuw werd omgezet met een nauwkeurigheid van ongeveer 95%. Er waren enkele vreemde spatiëringproblemen en de software had problemen met het converteren van het lettertype rechtsboven in het document en miste hier en daar een paar tekens.

Vonnis
Als u eenvoudig opgemaakte documenten naar PDF wilt converteren, is dit een fantastische tool. Wat betreft de conversie naar DOC waren de resultaten niets om over naar huis te schrijven.

i2OCR maakt indrukwekkende claims. De tool herkent meer dan 60 talen, kan lay-outs met meerdere kolommen aan (door de opmaak te verwijderen), heeft geen limieten voor de bestandsgrootte, kan geüploade bestanden converteren en van URL's. En u hoeft zich ook niet te registreren om deze tool te gebruiken.

De service werkt door de tekst eenvoudig uit uw afbeelding te extraheren en vervolgens ongeformatteerde tekst uit te voeren. U kunt snel fouten in de zij-aan-zijweergave corrigeren voordat u de tekst naar andere programma's kopieert of downloadt als DOC, PDF of HTML.

Opmerking: toen ik probeerde mijn PDF-documenten te uploaden, werden deze afgewezen door i2OCR, dus ik moest deze naar JPEG converteren (door er een screenshot van te maken en vervolgens de bestanden te uploaden).

Basisdocument naar platte tekstSchermopname 2016-02-11 om 12.30.28
Door de manier waarop deze tool werkt, gaat alle opmaak verloren, hoewel de conversie van afbeelding naar tekst bijna perfect was. Er waren enkele kleine fouten, zoals alinea-afstand, en sommige komma's werden vervangen door punten, maar dit zijn kleine probleempjes.

Complex document naar platte tekstSchermopname 2016-02-11 om 12.39.48
Het merendeel van de tekst is zonder al te veel fouten geconverteerd, afgezien van de titel en het recept rechtsboven, wat voor deze tool onleesbaar was. De manier waarop de kolommen naar platte tekst werden geconverteerd, was verre van ideaal. Als u deze conversie werkbaar wilt maken, zou er veel tijd nodig zijn om de regels opnieuw te ordenen in samenhangende zinnen.

Vonnis
Voor basisdocumenten werkt i2OCR prima. De mogelijkheid om de tekst te bewerken voordat deze wordt gedownload, is ook een erg leuke bijkomstigheid. Voor complexere documenten is de conversie echter nog steeds vrij nauwkeurig, maar de manier waarop de tekst wordt uitgevoerd, zal uw leven niet veel gemakkelijker maken.

Online OCR ondersteunt momenteel 46 verschillende talen en kan PDF, JPG, BMP, TIFF en GIF converteren naar Word-, Excel- of platte-tekstformaat. De site beweert "geconverteerde documenten zien er precies zo uit als het origineel - tabellen, kolommen en afbeeldingen".

Met de versie die u kunt gebruiken zonder te registreren, kunt u maximaal 15 afbeeldingen per uur converteren (limiet van 5 MB). Als u zich aanmeldt voor een account, kunt u bovenop deze limiet meer pagina's kopen, terwijl u ook documenten met meerdere pagina's en ZIP-archieven kunt converteren.

Online OCR-resultaten

Basisdocument naar DOC
Het basisdocument is foutloos omgezet, afgezien van het Romeinse cijfer ik niet worden opgepikt. Zoals de site beloofde, was de opmaak precies zoals in het boek. Een pluim voor deze tool.

Complex document naar DOC
Nadat ik teleurgesteld was door de vorige OCR-tools bij het converteren van het complexe document, was ik enorm onder de indruk van Online OCR. De lay-out was bijna perfect, zoals je hierboven kunt zien. Maar nogmaals, het recept werd niet zo goed opgepikt, maar alle andere kleine fouten waren te verwaarlozen.

Vonnis

Absoluut fantastische resultaten van online OCR. Het enige nadeel dat ik zie, is dat er geen manier is om de geconverteerde documenten als PDF's te downloaden, aangezien de genoemde uitvoerformaten alleen DOCX, XLSX en TXT omvatten.

Zoals eerder vermeld, is ABBYY een van de marktleiders in OCR-software en kost het ongeveer $ 150 voor hun volledige, downloadbare programma. Ze bieden wel een Gratis proefperiode van 10 pagina's voor hun online tool (registratie vereist). Voor een abonnement van $ 5 kunt u met hun online tool elke maand 200 pagina's converteren.

ABBYY FineReader Online

Geaccepteerde bestanden kunnen tot 100 MB zijn, in elk van deze formaten: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP en PNG. ABBYY herkent ook bijna 200 talen. Uitgangen zijn bijzonder indrukwekkend, met een keuze tussen DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 en EPUB.

U kunt tijdens uw proefperiode zelfs een aantal BETA-functies uitproberen. De eerste is de mogelijkheid om uw document in een andere taal te vertalen. De andere is om uw geconverteerde document naar uw cloudopslagaccount te exporteren, of dat nu Dropbox, Google Drive, Evernote, Microsoft OneDrive of Box is.

Basisdocument naar DOCX
De algehele resultaten waren goed, maar niet verbazingwekkend aangezien dit een premium product is. Meerdere komma's en punten werden omgewisseld, verschillende aanhalingstekens werden vervangen door een asterix, een paar hoofdletters ontbraken en één woord (literalist) werd verkeerd gespeld.

Complex document naar DOCX
Eenmaal geconverteerd waren er zeer weinig fouten in de tekst in het document (afgezien van de OCR die weer worstelt met het lettertype van dat recept!), Maar de opmaak liet veel te wensen over.

ABBYY-resultaat

De drie kolommen namen op de een of andere manier twee pagina's in beslag, met de centrale kolom enkel en alleen verschijnt op de tweede pagina. Als je dat echt wilde Doen alles met dit geconverteerde document, zou je uiteindelijk je haar uittrekken.

Basisdocument naar PDF
Tijdens het bekijken van de geconverteerde PDF kon ik helemaal geen fout vinden. Misschien hebben we ontdekt waar ABBYY uitblinkt. Fantastische resultaten.

Complex document naar PDF
Nogmaals, ik kon geen fouten vinden in dit geconverteerde bestand. ABBYY weet duidelijk hoe ze uitzonderlijk goed naar PDF kan converteren.

Vonnis
Als u graag een paar dollar betaalt, lijkt het converteren naar PDF fenomenaal goed te werken met deze service en zijn de mogelijkheid om geconverteerde bestanden naar uw cloudopslag te synchroniseren, is vooral handig als u een groot volume scant documenten. Net als bij de andere opties, heeft ABBYY nog steeds niet uitgezocht hoe documenten perfect kunnen worden geconverteerd naar DOC voor eenvoudige bewerking.

Het uiteindelijke resultaat

Als u, zoals de meeste mensen, alleen maar een paar tijdschriftartikelen en wat rekeningen voor het huishouden wilt scannen, hoeft u deze documenten niet te bewerken. Daarom is rechtstreeks converteren naar een PDF geschikt voor u, omdat u nog steeds in die documenten kunt zoeken. Hiervoor was gratis online OCR absoluut de beste gratis tool die we hebben getest. Dat gezegd hebbende, als je bereid bent om $ 5 per maand te betalen voor bijna perfectie, FineReader Online van ABBYY was iets nauwkeuriger.

Als het gaat om het converteren van documenten naar DOC, zijn we er niet in geslaagd een perfecte oplossing te vinden, maar verreweg de beste resultaten kwamen van Online OCR. De conversie was niet perfect, maar de integriteit van de opmaak bleef grotendeels intact en fouten waren te verwaarlozen. Wanneer we deze resultaten vergelijken met het "premium" -aanbod van ABBYY, kunt u niet anders dan enorm onder de indruk zijn.

We hebben niet opgenomen De OCR-mogelijkheden van Google Drive in deze post; een klein beetje voor de alomtegenwoordigheid van Google, maar meer omdat we een paar andere gratis online OCR-services wilden testen.

Aan jou: welke andere online OCR-tools zou je onze lezers aanraden? En welke heb je geprobeerd die je nooit meer zou gebruiken?

Rob Nightingale heeft een graad in filosofie behaald aan de Universiteit van York, VK. Hij werkte meer dan vijf jaar als social media manager en consultant en gaf workshops in verschillende landen. De afgelopen twee jaar is Rob ook schrijver van technologie geweest en is hij Social Media Manager van MakeUseOf en nieuwsbriefredacteur. Je zult hem meestal zien reizen op de...