Scans automatisch klassifizieren

Damit man möglichst wenig Arbeit und gleichzeitig den maximalen Nutzen mit gescannter Eingangskorrespondenz hat, sollte diese möglichst automatisch klassifiziert werden. Für die typischen Belegdaten wie Absender, Empfänger, Belegbetrag, IBAN & Co. macht GREYHOUND das ganz von allein. Es gibt aber natürlich auch Daten, die individuell in eurem Unternehmen häufig vorkommen und die ihr automatisiert erfassen wollt, wie z. B. eine Lieferschein-Nummer. Wie das geht, erfahrt ihr hier.

Damit die automatische Klassifizierung in GREYHOUND klappt, sind vier Voraussetzungen zu erfüllen:

  1. Das gescannte Dokument muss per OCR möglichst fehlerfrei in durchsuchbaren Text umgewandelt werden.
  2. Es muss ein entsprechendes Benutzerdefinierte Felder angelegt werden, in denen man einen Regulären Ausdruck hinterlegt, der den jeweiligen Eintrag finden und extrahieren kann.

OCR-Erkennung

Die TOCR-Engine zur Texterkennung ist fester Bestandteil von GREYHOUND und analysiert automatische sämtliche eingehende Briefe und Faxe mit guter Erkennungsgenauigkeit. Das schafft eine optimale Grundvoraussetzung für das textbasierte Klassifizieren von Dokumenten, z. B. anhand von enthaltenen individuellen Zahlenfolgen wie Lieferschein-Nummern.

Benutzerdefiniertes Feld anlegen

In GREYHOUND kann man beliebig viele benutzerdefinierte Felder anlegen und dadurch auch Datenfelder anlegen, die GREYHOUND von Haus aus nicht kennt – perfekt, um die Software an die eigenen Bedürfnisse anzupassen. Der folgende Screenshot zeigt, wie man mit “Einstellungen -> Benutzerdefinierte Felder -> neues Feld erstellen” einfach ein neues Feld “Lieferschein-Nummer” anlegt:

Wichtig ist, dass man auswählt, für welche Elementtypen dieser Wert zur Verfügung stehen soll. Nachdem man den Namen, die Beschreibung und die Verfügbarkeit ausgewählt hat, wechselt man zum Reiter “Automatische Kontaktzuordnung/Datenübernahem” und trägt dort bei “Regulärer Ausdruck” einen entsprechenden regulären Ausdruck ein, der die individuelle Zahlenfolge eurer Lieferschein-Nummern abbildet. Mehr zum Thema reguläre Ausdrücke ist hier zu finden.

Anschließend terägt GREYHOUND ganz automatisch bei allen Elementen, für die das benutzerdefinierte Feld zur Verfügung gestellt wurde, und bei denen eine Zahlenfolge gefunden wird, die wie eine Lieferschein-Nummer aufgebaut ist, diesen Wert in das entsprechende Feld ein.