ABBYY Finereader Express 8.4: erkennen Text aus einer beliebigen Quelle on the fly (Code der Verteilung abgeschlossen)
Makradar Technologie / / December 19, 2019
Digitale Inhalte und elektronische Versionen von Dokumenten umgeben uns auf allen Seiten. Papier in unserem Leben ist fast kein Platz mehr. Zeitungen und Zeitschriften sind in das Online-Format des Buchs bewegen wir auf E-Ink-Reader oder Tablet lesen, haben gewöhnliche Buchstaben E-Mail und SMS ersetzt. Doch manchmal müssen wir basteln mit den ersten Arbeiten sie eine elektronische Kopie zu erhalten. Hier kommen wir auf die Hilfe von speziellen Programmen, die OCR-Technologie, um OCR-Text (Optical Character Recognition) verwenden. Der berühmteste von ihnen ist zweifellos ABBYYFineReader. Sie können es verwenden, um Papierdokumente in bearbeitbare Formate zu umwandeln und die PDF in durchsuchbare Text speichern. Und heute haben wir eine große Chance, um mehr zu erfahren über sie.
* * *
Für Macs, ABBYY bietet nur Reader Express, hat es dennoch die notwendige Funktionalität. Die wichtigsten Funktionen von ABBYY Finereader Express ist eine Erkennungsgenauigkeit und Layout-Übernahme, Unterstützung für viele Sprachen (171 Sprache zu den drei Sprachen in einem Dokument), die Umwandlung und die Erstellung von PDF (PDF-Konvertierung in editierbare Formate), Editor für die manuelle Markierungsflächen (Text, Tabelle, Bild) und eine einfache, benutzerfreundliche Oberfläche Programm.
erster Blick
Finereader Express Betriebsfenster ist sehr minimalistisch, gibt es nur die notwendigsten Gegenstände. Die Seitenwand enthält Skizzen hinzugefügt Seiten und auf isntrumentov Panel-Tasten mit Drop-Down-Listen der Sprache und die Ausgabedatei auszuwählen. Noch gibt es die Umwandlung und die Zoom-Taste. Ansonsten ist die Schnittstelle entspricht eine schnelle Express-Version, die Wette auf der automatischen Ausführung von Operationen mit einem Minimum an Konfiguration und zur Beteiligung der Nutzer.
Führen Sie die Tests
Reader erfüllt uns ein kompaktes Fenster mit einer Auswahl von Szenario nach dem Start. Hier sind wir aufgefordert, die Aufnahmequelle auszuwählen: Scanner, Fax, oder aus einer Datei zu lesen. Es ist auch ratsam, eine Sprache (oder Sprachen, wenn mehr als ein) angeben - es wird helfen, die Erkennungsgenauigkeit des Originaldokumentes zu verbessern. Na ja, eigentlich das Ausgabedateiformat, alles ist einfach - wählen basierend auf der Art des Papierdokuments.
Scanner zur Hand habe ich nicht, aber es ist noch besser - mit als die Quelle des Fotos mit Hilfe des iPhone gemacht, ich habe die Aufgabe Text zu erkennen kompliziert. Als Beispiel für den Text, nahm ich eines der Bücher seiner Frau, sowie ein Beispiel für die Tabelle - einige alte Arbeitsfilmsendung iPhone. Nun, lassen Sie uns beginnen.
Jede Seite mit Text
Aus Mangel an einem Scanner habe ich gerade ein Buch wiederum Fotos - Foto normales Raumlicht, kein Stativ und andere Verbesserungen. Hier ist das Original:
Mal sehen, was es mit Reader tun können. Wir spezifizieren, dass wir das Foto Text, definieren Sie die Sprache wie Russisch herausziehen wollen, und starten Sie den Vorgang.
Zu seinem Kredit, muss die Anwendung gesagt werden, dass der gesamte Text definiert wurde, einschließlich dem aus Versehen bekam die benachbarte Seite zu biegen. Ein Stück der Tabelle, die ich speziell im Rahmen links, wie das erwarteten Bild definiert. Aber es ist nicht beängstigend, weil wir manuell die Domäne ändern können, geben Sie seinen Typ (falls das Programm nicht richtig eingestellt ist) und entfernen Sie das Feld, die Anerkennung, die erforderlich ist. Alle Manipulationen hat mich weniger als eine Minute, aber am Ende habe ich hier bekam ein recht akzeptables Ergebnis:
Nach einer kurzen Korrektur und Bearbeitung ist das Dokument bereit. Ich denke, dies ist ein gutes Ergebnis für eine solche schnelle, fast automatische Erkennungsprozess.
erkennen Tisch
Als Versuchstisch dient anspruchslos Rechnung, die auch auf dem iPhone gedreht wurde. Es ist bereits in Gebrauch Ukrainian (zusammen mit Check Sprachunterstützung), die für unsere Erfahrung auch gut. Die Wahl eines neuen Skripts (⌘N) Geben Sie die Quelle - aus einer Datei lesen, die Sprache - Ukrainisch und Dateiausgabe - Tabelle.
Das Programm denkt ein paar Sekunden, und hier haben wir das Ergebnis:
Mit dem Tischprogramm nicht so gut behandelt wird, aber es ist mehr oder weniger akzeptabel ist, im Prinzip der Wortlaut der Definition, es sei denn, den Grund, um die Zellen zu beenden, die nicht im Originaldokument war. Es wird ein wenig länger basteln die endgültige Form des Kartendokument zu erhalten, aber es ist einfacher, als ein Zeichen mit der Hand von Grund auf neu eingeben.
Als PDF speichern
Wenn PDF zu speichern, wird das Programm leider nicht das Originalbild verbessern (Kontrast, Helligkeit), und es wird im PDF-Dokument platziert, wie ist. Aber je weniger, ist der Suchtext vorhanden ist, und das ist gut.
Ergebnis
Wie jedes Werkzeug hat Reader seine Vor- und Nachteile. Die Stärken, zusätzlich zu den genannten Eigenschaften des Herstellers, ist, dass die OCR Tabellen und recht gut funktioniert, und convert PDF, Suche, wie versprochen, unterstützt Text. Der Nachteil ist der Mangel an Möglichkeiten und sehr magerer Mittel für den Prozess manuell zu steuern. Aber dies ist teilweise gerechtfertigt, die Tatsache, dass es eine Express-Version ist und es funktioniert automatisch.
Codes für Finereader Express Programm gewonnen Gregory Ushar und Nikolai Blinov. Herzlichen Glückwunsch! Überprüfen Sie Ihre private Nachrichten, Codes gesendet.