Digital-Dienstleister in Ihrer Region
Anbieter. Bewertungen. Jobs.

Aktuelle Beiträge

Scan-Service / Handschriftenerkennung
Schnipselarbeiter senken Fehlerquote

Handschriftliche Eintragungen fehlerfrei zu erkennen, zählt zu den großen Herausforderungen für Scan-Dienstleister. Die automatisierte Texterkennung stößt hier an ihre Grenzen. Ein Berliner Startup lässt daher Crowdworker in aller Welt über den richtigen Wert von Buchstaben und Zahlen entscheiden.

ewlan.jpg/

Anmeldungen, Änderungen oder Kündigungen: Wichtige Dokumente werden auch im digitalen Zeitalter per Hand ausgefüllt und anschließend als Papier oder als Foto verschickt. Die Indizierung und Klassifizierung dieser Dokumente ist daher mit viel Aufwand verbunden. „Selbst mit modernster Texterkennungs-Software lassen sich nur rund 50 Prozent der handschriftlichen Eintragungen fehlerfrei erkennen“, sagt Steffen Unmuth, Vertriebsdirektor beim Scanner-Produzenten ibml. „An einer Prüfung durch den Menschen führt daher nach wie vor kein Weg vorbei.“

Fehlendes Personal wird zum produktiven Flaschenhals

Das Scan-Volumen in vielen Unternehmen steigt – und damit die Auslastung der internen oder externen Dienstleister. Fehlendes Personal erweist sich daher immer öfter als produktiver Flaschenhals, denn auch hier werden die Fachkräfte knapp. Ausgerechnet unleserliche Handschriften zeigen der Digitalisierungs-Branche ihre Grenzen auf.

Ein Berliner Startup Abhilfe verspricht Abhilfe. „Mit Hilfe unseres Internetportals steigern wir die Erkennungsquote bei Handschriften nachweislich auf über 99 Prozent“, sagt Ralf Göbel, COO bei der ScaleHub AG. „Das schaffen wir, in dem wir Automatisierung und Crowd-Working kombinieren.“

Das Internetportal spielt den Ausputzer für all das, was die Texterkennungs-Software nicht schafft. Das Zusammenspiel funktioniert wie folgt:

Schnipsel-Pakete werden in alle Welt verschickt

Der Crowd Connector von ScaleHub extrahiert in den gescannten Dokumenten all jene Felder, die die Texterkennung nicht einwandfrei erkennen kann und schneidet sie in kleine Bild-Schnipsel. Diese übergibt sie an das Portal, wo sie zu übersichtlichen, homogenen Paketen zusammengefasst werden. Ein Paket enthält beispielsweise nur Postleitzahlen, das nächste nur Straßennamen, das dritte nur E-Mail-Adressen. Diese Pakete werden dann an Crowd-Worker in aller Welt verschickt, die die einzelnen Schnipsel prüfen und ihnen einen Wert - einen Buchstaben, eine Zahl oder ein Wort – zuweisen. Diese Information schicken sie zurück an das Portal, das sie zurück in den Crowd Connector exportiert. Von da aus gelangt sie in die Datenbank der Digitalisierungsplattform des Kunden und ergänzen die Ergebnisse der Texterkennung. Damit ist die Handschrift nach Aussagen des Anbieters zu nahezu 100 Prozent digitalisiert.

Göbel gehört zu den Gründern der 2016 gegründeten ScaleHub AG. Seit mehr als zwei Jahrzehnten ist er im Markt für Texterkennung unterwegs. Die hohen Fehlerquoten bei der Erkennung von Handschriften beschäftigen ihn seit langem. „Handschriften sind extrem unterschiedlich“, sagt er. Es brauche hohe Investments und lange Trainingszeiten, um die maschinelle Erkennungsquote zu verbessern. Dennoch bleibe am Ende die entscheidende Frage meist unbeantwortet: „Kann der Nutzer dem Ergebnis tatsächlich vertrauen?“

ScaleHub hat ein Verfahren entwickelt, mit der sich diese Frage mit einem klaren „ja“ beantworten lassen soll. Für sein Internetportal hat das Unternehmen einen speziellen Workflow entwickelt. Für die Akquise der Crowd-Worker hingegen greift es auf den Dienst Amazon Mechanical Turk (AMT) zurück. Die Bezeichnung geht angeblich auf einen vermeintlichen Schachroboter zurück, der 1769 konstruiert wurde. Sein Erfinder ließ den Eindruck entstehen, dass das Gerät selbstständig Schach spielte, indem er darin einen menschlichen Schachspieler versteckte.

Amazon bietet Marktplatz für Gelegenheitsarbeiten

Warum das Vorspiegeln falscher Tatsachen seitdem auch als „Türken“ bezeichnet wird, ist selbst unter Experten nicht abschließend geklärt. Auch der Status der Crowdworker ist umstritten. Übersetzen lässt sich der Begriff mit „Globale Gelegenheitsarbeiter“. Im speziellen Fall der Scan-Anwendungen würde auch „Schnipselarbeiter“ passen.

Bei AMT handelt es sich um einen Online-Marktplatz für Gelegenheitsarbeiten, der menschliche Intelligenz erfordert. Crowdworker, die sich auf AMT registriert haben, erhalten Aufträge von Dritten, die sie dann abarbeiten. Der Preis richtet sich nach Angebot und Nachfrage. Für Kleinstarbeiten wie die Schnipselerkennung werden Cent-Beträge gezahlt.

ScaleHub akquiriert auf diesem Wege Menschen, die auf ihrem Smartphone, Laptop oder PC Schnipsel mit handschriftlichen Zahlen, Buchstaben und Wörter identifizieren. „Zwei Menschen validieren jeweils den gleichen Schnipsel“, erklärt Göbel die Vorgehensweise. „Kommen sie zum gleichen Ergebnis, wird der Wert in die Datenbank gespeist. Weichen die Ergebnis voneinander ab, wird ein Supervisor eingeschaltet, der endgültig entscheidet.“

Kunden können sprachliche und fachliche Kompetenzen wählen

Die Berliner bieten verschiedene Preis-Leistungs-Optionen an. Kunden können beispielsweise wählen, welche sprachlichen und fachlichen Kompetenzen die Crowdworker mitbringen sollen und wie schnell die Prüfung der Schnipsel erfolgen soll.

Seit Mitte 2017 können den AMT-Dienst auch Kunden außerhalb der USA nutzen. Wenige Monate später ging ScaleHub mit seinem Internetportal kommerziell an den Start. „In Deutschland zählen wir aktuell sechs Kunden, in den USA sind es vier“, sagt Göbel. „Diese speisen pro Tag im Durchschnitt mehr als 500.000 Schnipsel auf unsere Internetplattform ein.“ Göbel rechnet damit, dass die Nutzungszahlen weiter steigen – weil das Scan-Volumen wachse und das Angebot seines Unternehmens flexibel skalierbar ist. „Bei uns gibt es keine Mindestabnahmemengen“, sagt Göbel.

Noch ist das StartUp mit seinem Angebot in Europa fast allein auf weiter Flur. Wie erfolgreich das Geschäftsmodell tatsächlich ist, wird sich daher auch daran messen lassen, wie viele Wettbewerber in nächster Zeit in diesen Markt einsteigen.

Veröffentlicht am 13.05.2019


Assoziierte Fokusthemen