Funktionsweise von Texterkennungssoftware
Archivierungssoftware (etwa DocuWare) ersetzt nicht nur lange Reihen von Aktenordnern, sondern erleichtert die Arbeit auch erheblich, da alle Dokumente sofort zur Verfügung stehen. Allerdings müssen eingescannte Dokumente mit Schlagworten versehen werden – und das passiert z.B. bei bestimmten Belegarten wie Schriftverkehr oder Projektdokumenten in der Regel halbmanuell. Da jedes Dokument einzeln durchgesehen und abgelegt werden muss, ist dies ein aufwändiger Vorgang. Diese Arbeit kann bei Posteingangs-Dokumenten zu einem Großteil von modernen OCR- und ICR-Programmen übernommen werden. OCR steht für „Optical Character Recognition“ (Optische Zeichenerkennung), ICR für „Intelligent Character Recognition“, d.h. Intelligente Zeichenerkennung. OCR-Programme „erkennen“ gedruckte Buchstaben, Barcodes und Zahlen. Sie können aufgrund des Dokumentaufbaus deuten, wann Dokumente bzw. deren Inhalte beginnen und enden und sind ebenfalls in der Lage, aus Begriffen zu schließen, in welchen Bereich ein Dokument gehört.
Software ist selbstlernend
Keine Texterkennungssoftware liest jedes Zeichen richtig. Beispielsweise können handschriftliche Eintragungen, dunkles Papier oder schräg gedruckter Text das Ergebnis trotz in diesen Systemen enthaltener, optimierter Belegverbesserung verzerren. Wenn die Texterkennungsprogramme Worte oder Zahlen nicht sicher erkennen, markieren sie die Zweifelsfälle und bieten die Möglichkeit zur manuellen Nachkorrektur. Ganz lässt sich also auch mit Texterkennungssoftware das Prüfen durch Mitarbeiter nicht verhindern, es wird aber extrem eingeschränkt.
Das liegt auch an zwei besonderen Stärken von Erkennungsprogrammen – ihrer Skalierbarkeit sowie ihrer Lernfähigkeit. Zum einen lassen sich die Softwarelösungen nach den eigenen Anforderungen einstellen, zum anderen „merken“ sie sich, wenn ein Wort nachträglich korrigiert wurde und stellen es beim nächsten Mal richtig dar.
Programme sind fähig zur Freiformerkennung
Weiterhin können die Programme Dokumente automatisch klassifizieren. Damit sind wir bei der intelligenten Zeichenerkennung. Die Software kann Daten insbesondere sogar dann ausmachen, wenn sie sich an unterschiedlichen Stellen in den einzelnen Dokumenten einer Klasse befinden. Wichtige Schlagworte und Wortfolgen erkennt die Software z.B. in einer Rechnung an Begriffen wie „wir berechnen“ oder einfach an dem Wort „Rechnung“. Ergänzend kann das System beispielsweise externe Datenbestände (z.B. aus dem Einkauf) heranziehen, welche aus ERP-Lösungen wie z.B. Nemetscheks Bau für Windows oder Bau financials oder über ODBC-Datenbanken bereitgestellt werden, um Rechnungs- und Bestelldaten abzugleichen. Darüber hinaus werden bei der Erfassung Unregelmäßigkeiten einer Rechnung erkannt und z.B. auf fehlerhafte Mehrwertsteuerbeträge verwiesen, die dann manuell nachbearbeitet werden. Die Software prüft automatisch, ob auf den Belegen bestimmte Informationen enthalten sind – als Beispiele seien die Steuernummer/UST-ID bzw. der bei Nachunternehmerrechnungen zwingend erforderliche „§13b-Passus“ (Steuerschuld Bauleistender) genannt. Fehlen diese Informationen, so werden die geprüften Dokumente „zurück zum Lieferanten“ geschickt. Die ICR-Software arbeitet also sozusagen eine „Checkliste“ von wichtigen Dokumenteigenschaften ab. Die ‚fertigen‘ (und für gut befundenen) Daten samt Dokument werden anschließend automatisch an die Folgesysteme (DocuWare/JobRouter) zur weiteren Bearbeitung weitergegeben. So lassen sich wesentliche Daten auch in Dokumenten mit wenig Struktur auslesen und identifizieren. Dies bezeichnet man als Freiformerkennung.
Fazit
Texterkennungsprogramme wie smartFIX, AnyDoc oder RecSolution prüfen eingescannte Dokumente und stellen sie für Folgesysteme zur Verfügung. Aufgrund ihrer Vielseitigkeit können sie wichtige Hilfsmittel im Erfassungs-Workflow sein. Wenn Sie mehr über OCR-/ICR-Programme wissen möchten, wenden Sie sich einfach an Thorsten Sprenger unter +49 4202 989-231 bzw. sprenger@bausoftware.de.