Zum Inhalt springen
Der Guide für ein smartes Leben.
Fotografieren statt abtippen

Teil 2: FineReader gegen OmniPage

Autor: Redaktion pcmagazin • 28.12.2007 • ca. 2:20 Min

Inhalt
  1. FineReader gegen OmniPage
  2. Teil 2: FineReader gegen OmniPage
  3. Teil 3: FineReader gegen OmniPage

Von der verbesserten OCR-Engine in beiden Produkten profitieren Anwender, die Inhalte aus niedrig aufgelösten Faxen oder Screenshots weiterverarbeiten wollen. Kleingedrucktes in Verträgen identifiziert FineReader beispielsweise zu über 90 Prozent korrekt. OmniPage erreicht diese Erkennungsgenauig...

Von der verbesserten OCR-Engine in beiden Produkten profitieren Anwender, die Inhalte aus niedrig aufgelösten Faxen oder Screenshots weiterverarbeiten wollen. Kleingedrucktes in Verträgen identifiziert FineReader beispielsweise zu über 90 Prozent korrekt. OmniPage erreicht diese Erkennungsgenauigkeit erst bei höherer Scan-Auflösung. Während FineReader bei 300 dpi lesbaren Text ausgibt, produziert der Konkurrent erst bei 600 dpi verwertbare Inhalte.

Nahezu gleich gut lesen FineReader und OmniPage eine aufgeklappte Buchdoppelseite ein. Beide Programme trennen die Seiten korrekt, begradigen aber nur die linke. Trotzdem werden die Texte auch auf der rechten Seiten nahezu hundertprozentig erkannt. Bei der Umsetzung in Word verwenden die Tools allerdings Textkästen, die sich auf der schiefen rechten Seite teilweise überlappen. Benutzer korrigieren dies in der Textverarbeitung mit wenigen Mausklicks oder aktivieren in den OCR-Programmen die automatische Seitentrennung. Dann werden beide Buchseiten geradegerichtet.

Fotografieren statt abtippen
Aufgeklappt: Die Buchdoppelseite teilt FineReader vor der Texterkennung.
© Archiv

Nie wieder Tabelleninhalte abtippen

In Textkästen setzen beide Produkte sogar Tabellen ohne Gitternetz um. Der Anwender muss die Tabelle dann selbst bauen. Sind Linien auf den Vorlagen vorhanden, identifizieren FineReader und OmniPage die Inhalte und die Aufteilung korrekt - auch wenn Zellen verbunden sind. FineReader produziert - anders als die Vorversion und der Rivale - Fehler bei sinnlosen Zeichenfolgen in einer Code-Tabelle.

Fotografieren statt abtippen
Unknackbar: Am Auslesen des Verifikations-Code auf Anmeldeseiten scheitert auch FineReader.
© Archiv

Dagegen übernimmt die Abbyy-Software aus mehrsprachigen Vorlagen erstmals Akzente und Umlaute. Im Gegensatz zu OmniPage profitiert FineReader von der automatischen Erkennung der Dokumentsprache, die im Test auch bei verschiedensprachigen Absätzen auf einer Seite funktioniert. Das Nuance-Tool übersieht die französischen Akzente, arbeitet ansonsten aber korrekt.

Falscher Alarm

Beide OCR-Programme erledigen Standardaufgaben wie das Einlesen von Geschäftsbriefen oder Rechungen tadellos. Nicht hundertprozentig identifizierte Zeichen sind in der Dokument-Vorschau markiert, leider größtenteils zu Unrecht. In circa 70 Prozent der Fälle stimmt das erkannte Zeichen mit dem auf der Vorlage überein. FineReader und OmniPage schlagen auch auf perfekt gescannten Vorlagen fälschlicherweise Alarm, insbesondere bei optisch ähnlichen Zeichen wie dem kleinem l, dem großem I, dem großem O und der 0 (Ziffer Null). Lesefehler passieren dank Vorverarbeitung aber nur selten. Dennoch: Die als unsicher erkannten Textteile prüft der Anwender, was im Fall von korrekten Zeichen die Korrektur unnötig verlängert.

Fotografieren statt abtippen
Korrektur: Beim Mausklick auf fehlerhaft erkannte Buchstaben zeigt OmniPage die Originalvorlage im Pop-up-Fenster an.
© Archiv

Assistenten vereinfachen Bedienung

Damit OCR sich auch von Einsteigern prompt bedienen lässt, ergänzen Abbyy und Nuance ihre Software um Assistenten sowie eine anpassbare Oberfläche. Das klassische dreigeteilte Programmfenster mit Dokumentenstapel, Vorverarbeitungs-Screen und Editor ersetzen Schritt-für-Schritt-Abfragen. FineReader verkürzt das Einlesen von Text auf einem Bild durch einen Menü-Knopf auf dem Startbildschirm: Nach dem Mausklick auf die Schaltfläche Foto in Microsoft Word umwandeln, wählt der Nutzer das Bild aus und erhält den erkannten Text in der Textverarbeitung. Wer OmniPage nicht starten will, greift über das Kontextmenü im Windows-Explorer auf die OCR-Engine zu, um Bilder in Texte zu konvertieren.

Fotografieren statt abtippen
Rundlauf: Anwender steigen an einem beliebigen Punkt in die Texterkennung ein.
© Archiv

Neue Office-Dateiformate und PDF

Beide Produkte sind bei den verfügbaren Exportfiltern nahe an den Erfordernissen der Endanwender: So unterstützen FineReader und OmniPage das Dateiformat des neuen Office 2007. Benutzer sichern ihre Daten so im XML-Format, was weniger Speicherplatz, Fehlertoleranz und Lesbarkeit in Programmen von Fremdherstellern bedeutet. Den ISO-Standard OpenDocument, der ebenfalls all diese Vorteile bietet, kann kein Testkandidaten exportieren. Für die Langzeitarchivierung schreiben FineReader und OmniPage jetzt den ISO-Standard PDF/A.

Fotografieren statt abtippen
Software:Büro-Software FineReader gegen OmniPage