• Dr. Christopher Czaban

Anwendungen und Anbieter für intelligente Dokumentenverarbeitung

Aktualisiert: 25. Juli

In diesem Blog-Post geben wir Ihnen einen Einblick in das Thema der intelligenten Dokumentenverarbeitung (zu Engl.: Intelligent Document Processing - IDP) mittels Künstlicher Intelligenz. Als eine Form der intelligenten Automatisierung ist IDP eine Lösung zur (voll-)automatisierten Verarbeitung von semi- oder unstrukturierten Geschäftsdokumenten variierenden Layouts. Wir erklären, wie Ihr Unternehmen durch den Einsatz von IDP maßgebliche Wettbewerbsvorteile erlangen kann.

Die hier angesprochenen Aspekte greifen wir in unserem exklusiven Bericht zu dem Thema auf und beleuchten diese im Detail. Darin enthalten ist eine umfangreiche und stetig wachsende Übersicht zu den IDP-Lösungen (insb. für den Deutschen Markt). Nach unserem derzeitigen Kenntnisstand (Juli. 2022) existiert keine in Umfang und Detailtiefe vergleichbare Liste.

Als unabhängiges Beratungsunternehmen und Experten für IDP ist es unser Ziel, Ihnen mit unserem ausführlichen Bericht das notwendige Rüstzeug an die Hand zu geben, die verschiedenen auf dem Markt erhältlichen Lösungen für IDP-Workflows kritisch betrachten und für Ihr eigenes Unternehmen die richtigen Entscheidungen treffen zu können. Wir nennen Ihnen die wichtigsten Kriterien, auf die es bei der Auswahl solcher Lösungen ankommt und definieren eine Reihe von Leitfragen, die Sie in Ihren eigenen Recherchen stellen können, um so zu einem begründeten Urteil sowie passender Auswahl zu gelangen.


Probleme bei der Verarbeitung unstrukturierter Daten ohne künstliche Intelligenz (KI)


Für viele Unternehmen besteht eine der größten Herausforderungen in der täglichen Verarbeitung gigantischer Mengen unstrukturierter Daten, die rund 80 Prozent der Daten eines Unternehmens ausmachen.

Unstrukturierte Daten folgen von Natur aus keinem festgelegten Format und lassen sich ohne den Einsatz fortschrittlicher KI-Technologien nicht gezielt extrahieren. Eingangsdokumente des selben Geschäftsprozesses (bspw. im Bereich der Rechnungs- oder Antragsverarbeitung) variieren typischerweise regelmäßig in Layout und Umfang. Eine “blinde” Software-Lösung ohne KI, die starre, regelbasierte Extraktionen durchführt, versagt hierbei auf ganzer Linie: Eine Variation des Dokumenten-Layouts könnte beispielsweise bewirken, dass an der Position im Dokument, an der heute die Vorgangsnummer steht, morgen der Name des Adressaten oder eine andere Information zu finden ist.

Für einen Großteil der Unternehmen besteht der einzige Weg zur Verarbeitung unstrukturierter Daten bzw. Dokumente häufig in der Durchführung aufwändiger, manueller Prozesse: Die benötigten Informationen werden durch mühsame Sichtung der Dokumente entnommen und nacheinander durch abtippen oder kopieren in Systeme zur weiteren Verarbeitung übertragen. Dafür zahlen Unternehmen einen hohen Preis mit folgenden Konsequenzen:

❌ Die Bindung menschlicher Arbeitskraft erzeugt hohe Ausgaben, die andererseits für wachstumsfördernde Investitionen fehlen.

❌ Fehleranfällige, manuelle Prozesse können in Bereichen hoher regulatorischer Anforderungen zu großen finanziellen Verlusten und Reputationsschäden führen.

❌ Hohe Bearbeitungszeiten durch manuelle und händische Prozesse.

❌ Mitarbeiter sind unzufrieden mit den monotonen, repetitiven und teils intellektuell anspruchslosen Aufgaben.


Begriffsklärung unterschiedlich strukturierter Daten. Unstrukturierte Daten stellen den größten Teil der Daten der meisten Unternehmen.

Vorteile einer KI-gestützten Dokumentenverarbeitung


💡 Die Lösung des o.g. Problems lautet IDP. In der heutigen Zeit ermöglichen Methoden der künstlichen Intelligenz, manuelle Prozesse bzw. die Verarbeitung unstrukturierter Daten nahezu komplett zu automatisieren.

Die KI-gestützte Verarbeitung textueller Daten ermöglicht Unternehmen die Einsparung personeller Kosten und Entlastung ihrer Mitarbeiter. Darüber hinaus erlaubt der Einsatz von KI die Analyse strategisch wichtiger Datenstrukturen, die bisher blinde Flecken in den Daten der Unternehmen darstellten.

Folgende Punkte gehören zu den bedeutendsten Vorteilen einer KI-gestützten Dokumentenverarbeitung:

Effizienz im operativen Bereich

🙍‍♂️Verbessertes Kundenerlebnis

👩‍💼Zufriedene Mitarbeiter

⚠️ Reduktion von Risiken bzgl. Finanzen und Reputation

Bei der Verarbeitung unstrukturierter Daten im Rahmen der IDP lassen sich Informationen mit der sogenannten Key Information Extraction (KIE)-Methode gezielt aus komplexen Dokumenten extrahieren. Nachfolgend werden wir die Begrifflichkeiten IDP und KIE kurz erläutern und zeigen einen kurzen Ausschnitt unserer umfangreicheren Recherche zum Anbietermarkt für IDP-Lösungen.


Was ist IDP und KIE?


Bei IDP handelt es sich um einen Prozess zur KI-gestützten, automatischen Verarbeitung unterschiedlich strukturierter Daten aus verschiedenen Dokumenttypen, wie beispielsweise E-Mails, PDF-Dateien, gescannte Dokumenten usw..

Falls es sich bei den zu verarbeitenden Dokumenten um Scans oder um Fotos handelt, erfolgt im ersten Schritt eines IDP-Workflows die Textidentifikation und -erkennung mittels OCR.

Bei der gleichzeitigen Verarbeitung von mehreren unterschiedlichen Dokumententypen kommt es zunächst zur Trennung der Dokumente, indem eine Klassifizierungs-KI die Art des Dokuments (z.B. Rechnung oder Vertrag) ermittelt.

Anschließend werden durch eine auf den jeweiligen Dokumententyp spezialisierte Extraktions-KI relevante Informationen aus den Dokumenten extrahiert und in ein strukturiertes Format mit eindeutiger Zuordnung (bspw. Adressat ↔ Max Mustermann) übertragen.

Schließlich erfolgt die Eingabe der Informationen in Systeme zur weiteren Verarbeitung oder Ablage (siehe Grafik unten).

Für die Extraktion der Daten aus den Dokumenten kommt die sogenannte Key Information Extraction (KIE) zur Anwendung, eine Deep Learning* (DL)-Methode, bei der Texte einer Reihe von Schlüsselfeldern in Dokumenten extrahiert werden. KIE-Modelle sind für viele Anwendungen wie Dokumentenanalyse, schnelle Indexierung sowie effiziente Archivierung unerlässlich und stellen bei vielen Diensten und Software-Lösungen für IDP die zentrale Komponente dar.

Von besonderer Bedeutung ist hierbei, dass es sich bei KIE-Modellen um “lernende” KI-Systeme handelt. Diese werden durch den stetigen Einsatz kontinuierlich verbessert. Abhängig von Komplexität und Umfang der Dokumente sowie der zu extrahierenden Daten können durch diese Eigenschaft Automatisierungsgrade von 80 bis nahezu 100 Prozent bei der Verarbeitung von Dokumenten erreicht werden.


Beispielhafter IDP-Workflow zur automatisierten Verarbeitung von Versicherungsverträgen und Beitragsrechnungen

(*Deep Learning (DL) ist eine Disziplin, die dem Bereich des maschinellen Lernens zugeordnet ist. DL-Modelle basieren auf neuronalen Netzen, die insbesondere bei der Verarbeitung unstrukturierter Daten extrem gute Ergebnisse erzielen und mittlerweile menschliche Leistungen in Genauigkeit sowie Geschwindigkeit bei weitem übertreffen.)


Hauptmerkmale moderner KIE-Lösungen


Im Repertoire einer zeitgemäßen Software-Lösung für KIE **sollten standardmäßig eine Reihe von Funktionalitäten enthalten sein. Beispiele sind unter anderem:

  • Out-of-the-Box (OOTB)-Modelle für verschiedene Dokumententypen oder die Möglichkeit, selbst individuelle Modelle erstellen zu können.

  • Modell-KPIs, die Aufschluss darüber geben, wieso das Modell in bestimmten Fällen und für bestimmte Dokumente besonders gut funktioniert und für andere nicht.

In unserem vollständigen Bericht nehmen wir eine Unterteilung dieser Hauptmerkmale in “Must-Haves” und “Should-Haves” vor und erklären, welche Funktionen wir für unerlässlich halten.


Welche KIE-Lösung ist die richtige?


Bei der Auswahl einer KIE-Lösung gibt es neben den oben genannte Hauptmerkmalen eine Reihe von Fragen, deren Klärung bereits vor dem Auswahlprozess unerlässlich ist, um die richtige Entscheidung treffen zu können. Eine dieser Frage bezieht sich auf den DSGVO-relevanten Umgang mit den Unternehmensdaten und lautet, ob die Lösung On-Premise auf einem eigenen Server (die Daten sind vollkommen abgeschottet) oder nur in der Cloud des Herstellers liegen kann. Diese und zahlreiche weitere wichtige Fragen diskutieren wir in unserem ausführlichen Bericht.


Marktübersicht


Als unabhängige Unternehmensberatung und Experten für den Einsatz von KI-Systemen zur intelligenten Dokumentenverarbeitung führen wir eine stetig wachsende Liste von Herstellern und ihren IDP-Lösungen, die wir Ihnen in unserem exklusiven IDP-Report zur Verfügung stellen. Nachfolgend sehen sie eine kurze, auf fünf Hersteller begrenzte Vorschau dieser Liste.

Herstellername

Produktname

On-Prem

Private Cloud

Individuelle Modelle

Manuelle Validierung & Modellverbesserung

Kostenfreie Features

Besonderheiten & Anmerkungen

White-Label-fähig

URL

Erkennt Checkboxes

Helm & Nagel GmbH

Konfuzio

Ja

Ja

Ja

Ja

SDK zur Dokumentenanalyse

Umfangreiches SDK zur Dokumentenanalyse sowie zum Modell-Training und weiteren Downstream NLP-Tasks

Ja

Ja

Microsoft

AI Builder

Nein

Nicht bekannt

Ja

Ja

30 Tage Testlizenz, volle Funktionalität

Enge Integration im Microsoft Ökosystem

Nein

Ja

parashift

parashift

Nein

Nein

Nein

Ja

Keine bekannt

Sehr viele Dokumententypen möglich, Möglichkeit der Validierung durch parashift.

Nein

Ja

BuildSimple

BuildSimple

Nein

Nein

Ja

Ja

Keine bekannt

Erkennung und Trennung mehrerer Dokumente in einer PDF

Nicht bekannt

Nicht bekannt

NATIF AI

NATIF AI

Nein

Nein

Nur über Hersteller

Nein

Testversion, 2 Dokumententypen, 20 Dokumente

Keine bekannt

Nicht bekannt

Nicht bekannt



Zusammenfassung


Hier noch einmal im Überblick die wichtigsten Punkten zur Intelligenten Dokumentenverarbeitung, zu Englisch: Intelligent Document Processing (IDP):

  • IDP-Systeme verwenden fortschrittliche KI-Methoden zum Scannen, Kategorisieren und Extrahieren von Daten und sind traditionelleren Methoden (starre und regelbasierte Datenextraktion) bei der Verarbeitung unterschiedlich strukturierter Dokumente weit überlegen.

  • Moderne IDP-Lösungen basieren auf der Key Information Extraction (KIE)-Methode und ermöglichen bei der Verarbeitung komplexer Dokumente in einigen Fällen einen Automatisierungsgrad von nahezu 100%.

  • Durch den Einsatz von IDP-Systemen erzielen Unternehmen unter anderem maßgebliche Wettbewerbsvorteile und Profit-Steigerungen.

Fazit


In diesem Blog-Post haben wir einige der wichtigsten Punkte zum Thema der intelligenten Dokumentenverarbeitung (IDP) zusammengefasst und eine Vorschau auf unseren vollständigen Bericht gegeben. Wir hoffen, Ihnen bzw. Ihrem Unternehmen damit hilfreiche Informationen bzw. einen Startpunkt bei der Suche nach Lösungen zum Umgang mit Ihren eigenen unstrukturierten Daten liefern zu können.

Wünschen Sie eine persönliche Beratung zu dem Thema, die über die hier dargestellten Informationen hinausgeht und eine Betrachtung ihrer individuellen Situation und Herausforderungen ermöglicht, konsultieren Sie uns gerne jederzeit für einen unverbindlichen Austausch.

Sind Sie Anbieter einer IDP-Lösung und möchten gerne in unserer Übersicht geführt werden? Kontaktieren Sie uns gerne und profitieren Sie durch die Aufmerksamkeit unserer Kunden.