OCR (optische Texterkennung) einfach erklärt

So funktioniert die optische Texterkennung

Wer früher ein Foto von einem Text gemacht hat, konnte dieses zwar lesen, es aber nicht weiter textlich verarbeiten. OCR Software macht genau das möglich. Ganz gleich, ob Sie ein gedrucktes Manual, ein Foto oder ein altes Fax in ein schreibbares Dokument umwandeln möchten, mit einem OCR Scanner stehen Ihnen die gewünschten Bilder bzw. PDF Dateien zum Bearbeiten bereit. 

Ihren Ursprung hat die optische Texterkennung in der Unterstützung sehbehinderter Menschen. Mittlerweile hat sich die Technik weiterentwickelt und deutlich verbessert – und sich damit in ganz neuen Bereiche durchgesetzt. Erfahren Sie hier mehr über die die OCR Texterkennung und wie Sie davon profitieren können.

Was bedeutet OCR?

Die Abkürzung OCR bedeutet Optical Character Recognition. Um die OCR Technologie zu verstehen, hilft folgendes Beispiel: Ohne OCR Texterkennung kann Ihr Rechner nicht unterscheiden, ob Sie ein Bild vom Teamevent hochladen oder einen Arbeitsvertrag einscannen. Der Computer erkennt gescannte Unterlagen anhand der Pixel, er kann das Dokument aber nicht lesen. 

Bisher – denn jetzt erkennt die optische Zeichenerkennung bzw. die OCR Software die einzelnen Buchstaben aus gedrucktem Text. Gescannte Dokumente werden so maschinell lesbar. Dies ermöglicht Ihnen, den erkannten Text zu bearbeiten und zu durchsuchen.

So nutzen Sie die OCR Technologie

Um digitale Dokumente oder papiergebundene Unterlagen umzuwandeln, brauchen Sie einen Scanner mit OCR Funktion, einen sogenannten OCR Scanner. Auch Desktop-Varianten oder cloudbasierte Lösungen bieten die Möglichkeit, die Datei in ein einfaches Textdokument umzuwandeln. 

Für Unternehmen bedeutet dies, dass vor allem alte Papierdokumente, die aktualisiert und bearbeitet werden sollen, durch das Scannen mit der OCR Texterkennung als digitale Text-Datei zur Verfügung stehen. Die Zeitersparnis ist dabei immens: Durch das Einscannen fällt das Abtippen weg, zudem ist diese Variante deutlicher sicherer. Natürlich können Sie auch eine PDF Datei oder alle anderen Unterlagen mit einem OCR Scanner umwandeln.

Was ist der Unterschied zwischen OCR und ICR?

Wie bereits beschrieben steht OCR für Optical Character Recognition, die Abkürzung ICR bedeutet Intelligent Character Recognition. Während bei OCR die automatische Texterkennung von eingescannten Dokumenten, die maschinell erstellt wurden, im Fokus steht, werden bei ICR handgeschriebene Unterlagen gelesen. Diese automatische Erkennung erweist sich als deutlich schwieriger, da der Abgleich von Buchstaben und Zeichen bei dieser Variante weitaus umfangreicher ist.

Wie funktioniert OCR?

Das Erkennen und Umwandeln der Textelemente erfolgt in mehreren Schritten. Wir haben es hier einfach und verständlich für Sie zusammengefasst:

  1. Im ersten Schritt wird eine Layoutanalyse vorgenommen. Diese beinhaltet den Seitenaufbau und die Unterscheidung von Bild-, Seiten- und Textelementen sowie den Aufbau des Dokuments beispielsweise durch Absätze.
  2. Im nächsten Schritt findet nun die Aufspaltung von Textblöcken in Sätze und von Wörter in einzelne Buchstaben statt. Sie werden mit Mustern aus Nachschlagewerken und dem Lexikon abgeglichen, um so möglichst genaue Ergebnisse zu liefern. Innerhalb kürzester Zeit erfolgt der Abgleich mit den Mustern aus der Datenbank. 
  3. Nachdem sie decodiert wurden, werden Sie im Anschluss wieder kombiniert zusammengesetzt und an die ursprüngliche Stelle im Text gesetzt. Nun ist das Textdokument fertig und kann von Ihnen bearbeitet werden. 

Besseres Vertragsmanagement mit DocuSign und OCR

Auch DocuSign nutzt die OCR Texterkennung und optimiert damit Ihr Vertragsmanagement. Unsere KI analysiert die Inhalte Ihrer Verträge und kann diese auf mögliche Fehler oder Konflikte mit Compliance-Vorgaben überprüfen. Erfahren Sie hier mehr über DocuSign Insight und holen Sie die neueste Technologie in Ihr Unternehmen.

Franciska Acs - DocuSign
Autor
Franciska Acs
Marketing Communications Manager
Veröffentlicht
Schlagwörter