Wer Zeit und damit Geld sparen will, der setzt heute auf digitalisierte und automatisierte Arbeitsprozesse. Besonders hilfreich dabei ist die sogenannte OCR-Technologie.
OCR steht für Optical Character Recognition, also eine optische Zeichenerkennung beziehungsweise Texterkennung. OCR hilft in der Buchhaltung dabei, das zeitaufwendige und sehr fehleranfällige Abtippen von Belegen zu umgehen. Mit Hilfe von OCR, werden auch bei Run my Accounts gescannte Papierdokumente und PDF-Dateien in bearbeitbare und durchsuchbare Dateien umgewandelt.
Wie funktioniert die OCR-Technologie?
Der Dokumentenscan ist eine Bildkopie eines Dokuments und wird auch Rastergrafik genannt. Er ist im Grunde eine Ansammlung schwarzer, weisser oder farbiger Bildpunkte. OCR beginnt mit einer mehrschrittigen Analyse des eingescannten Dokuments. Hierbei wird das Dokument zunächst in seine Einzelteile wie Absätze, Tabellen und Bilder zerlegt. Danach werden Zeilen, Wörter und dann die kleinsten Einheiten, also einzelne Buchstaben und Zahlen, erkannt. Diese kleinsten Einheiten werden von der OCR-Technologie mit Mustern verglichen und es werden verschiedenen Hypothesen vom Programm dazu aufgestellt. Hierbei kommen zwei Erkennungsarten zum Einsatz.
1. Merkmalserkennung
Von den circa zehn bisher entwickelten Methoden, sind die Raster-, Merkmals- und Strukturklassifizierung die bedeutendsten. Die verwendete OCR-Technologie kennt bestimmte Merkmale eines jeden Zeichens (Buchstaben, Zahlen). Die Merkmale eines Zeichens bleiben auch bei Veränderungen bestehen. Ändert sich beispielsweise die Schriftgrösse, so ändern sich die Merkmale des Zeichen nicht. Obligatorisch werden immer mehrere Erkennungsverfahren nacheinander in der die Merkmalserkennung genutzt. Die so gewonnen Ergebnisse werden dann verglichen und gewichtet. Die Zeichen mit der höchsten Wahrscheinlichkeit auf Richtigkeit werden schliesslich zu einem Text zusammengefasst.
2. Mustererkennung
Diese Methode vergleicht jedes Zeichen des Dokuments einzeln. Wie bei der Merkmalserkennung, wird dabei auf ein bereits vorhandenes Kontingent an Zeichenmuster zurückgegriffen. Dabei werden riesige Datenbanken mit verschiedenen Schriftarten verwendet. Sobald ein zuerkennendes Zeichen mit einem Zeichen aus dieser Datenbank übereinstimmt, gilt es als identifiziert. Diese Methode ist enorm zeitintensiv und nicht besonders präzise. Die Ursache dafür ist, dass ein Zeichen zu 100 Prozent mit den gespeicherten Zeichenvorlagen übereinstimmen muss. Besonders schwierig ist dabei der Fakt, dass auch die Schriftart, inklusive aller möglichen Formatierungen, vom zu identifizierenden Dokument und der Datenbank identisch sein muss.
OCR bei Run my Accounts
Kunden von Run my Accounts übersenden entweder direkt die gescannten Belege zur Weiterverarbeitung, oder leiten ihre Post zu Run my Accounts um. Die umgeleitete Post wird dann von uns zur Bearbeitung eingescannt. Um letztendlich von digitalisierten und automatisierten Prozessen profitieren zu können, reicht ein Scanner allein nicht aus. Es müssen die relevanten Informationen aus den Belegen herausgezogen werden. Ein Scanner erstellt lediglich ein Bild eines Dokuments und die OCR-Technologie stellt die erforderlichen Informationen der Belege bereit.
Die Buchhaltungssoftware von Run my Accounts nutzt die OCR-Technologie und ist somit in der Lage eingescannte Belege zu lesen und automatisiert zu verbuchen. Zusätzlich ist die Software intelligent: Sie lernt ständig dazu und optimiert sich quasi selbst. Bei Run my Accounts halten wir uns nicht mit dem lästigen Abtippen von Belegen auf, sondern gehen gleich zur Buchhaltung über, denn wir lieben und leben Buchhaltung.
Haben Sie Ihre OCR Verfahren validiert? d.h. geprüft, ob es in jedem Fall tut, was es tun sollte?
vor einigen Jahren gab es mit XEROX Dokumentenverarbeitungsgeräten massive Fehler, den XEROX erst nach langem Zögern zugegeben hat.
https://www.youtube.com/watch?v=7FeqF1-Z1g0
Freundliche Grüsse
Sehr geehrter Herr Peter Pianegonda
Vielen Dank für Ihren Kommentar und Ihre sehr berechtigte Frage. Die Fehleranfälligkeit sind uns schon sehr lange bewusst, weshalb wir auf eine doppelte Absicherung setzten. Da wir im Bereich Buchhaltung und Treuhand mit Daten arbeiten, welche bei falscher Verarbeitung ein katastrophales Ergebnis erbringen würden, setzen wir zusätzlich auf unsere Mitarbeiter als Prüfungsinstanz. Diese kontrollieren jeden Beleg auf seine Richtigkeit, damit es eben nicht zur Verarbeitung falscher Daten kommen kann. Das führt zu 100 Prozent richtig verarbeiteten Belegen.
Zusätzlich setzen wir bei unserem Algorithmus auf Maschine Learning, d.h. der Algorithmus wird von Beleg zu Beleg immer schlauer und damit steigt die Anzahl der richtig erkannten Daten. Diese liegt heute bei circa 96 Prozent.
Ich hoffe ich konnte Ihnen Ihre Frage beantworten und mögliche Bedenken ausräumen.
Viele Grüsse
Anja Schweppe von Run my Accounts
Guten Tag,
habe gerade diese Seite mit Interesse aufgemacht. OCR macht sicher unbedingt Sinn – vor allem wenn es gut gemacht ist und «dazulernt», wie Sie sagen. Aber wieso bieten Sie dann eine Excel-Vorlag für die Spesenabrechnung an??? Da muss man dann doch wieder Informationen von Belegen manuell eintragen. Ich erinnere mich bei Ihnen vor geraumer Zeit einen Artikel zur Nutzung von Expensify gelesen zu haben. Ich selber habe Expensify auch getestet und nutze seit 18 Monaten Xpenditure mehr oder weniger zufrieden; gepaart mit einer Legacy-Excel-Tabelle von meinem Treuhänder – nicht sehr zu meiner Zufriedenheit. Wirklich von Interesse für Startups wie meins (so wie für jede andere Firma auch) wäre eine sauber integrierte automatisierte Spesenabrechnung, die auch bzgl. Belegarchivierung für die ESTV wasserdicht ist.
Würde mich schon interessieren, ob Sie in dieser Richtung eine belastbare Lösung haben?
Freundliche Grüße,
Markus Valle-Klann
Sehr geehrter Herr Valle-Kahn
Vielen Dank für Ihren Kommentar. Run my Accounts steht für automatisierte Buchhaltungsprozesse. Wir arbeiten stets daran die Buchhaltung für KMU und Start-ups zu vereinfachen und dazu gehört sicherlich auch in naher Zukunft eine digitalisierte Lösung im Bereich der Spesen. Wir halten Sie weiterhin sehr gern auf dem Laufenden.
Viele Grüsse
Run my Accounts