KI - Semantische ANalysen
Semantische Analysen mit Scan2Knowledge
KI durch Scan2Knowledge für semantische Analysen
Die elektronische Akte ist nur ein halber Schritt zur Digitalisierung – um den ganzen Schritt zu gehen, muss auch die Semantik, der Inhalt der Dokumente, elektronisch erfasst und verarbeitbar gemacht werden. Dabei setzen wir sowohl auf die Auswertung von Fließtexten, wie im Projekt AFAIQ, als auch auf die Auswertung von Dokumenten, die durch Weißraum strukturiert werden, wie etwa Rechnungen, Gehaltsabrechnungen, Kfz-Papiere oder amtliche Bescheide.
Semantische Auswertung von layoutstrukturierten Dokumenten
Die automatische Auswertung von ähnlich strukturierten Rechnungen und Lieferscheinen auf wichtige Eckdaten ist längst Stand der Technik. Anspruchsvoller wird es, wenn komplexere Dokumente auszuwerten sind oder die eingehenden Dokumente von vielen unterschiedlichen Partnern stammen und entsprechend heterogen strukturiert sind.
Mit Scan2Knwoledge hat S&N Invent in Zusammenarbeit mit Kunden ein Werkzeug entwickelt, dass z.B. einen Strom eingehender Rechnungen von unterschiedlichsten Autohäusern ebenso auswertet, wie die Zulassungsbescheinigungen und andere Kfz-bezogene Dokumente.
Semantische Auswertung von Fließtexten
Grundlage unserer Methodik sind aktuelle Verfahren aus der natürlichsprachlichen Verarbeitung, wie sie auch im Produkt AFAIQ eingesetzt werden. Während sich ein großer Teil der verfügbaren Methoden stark an der Verarbeitung umgangssprachlicher Texte, etwa aus sozialen Medien, orientiert, haben wir unser Werkzeug stärker an formalen Textsorten ausgerichtet. Dies bedeutet z.B. den Umgang mit komplexen und umfangreichen Satzstrukturen und deren grammatische Analyse.
Mit unseren Methoden sind wir in der Lage, Informationen und Aussagen aus komplexen Fließtexten zu extrahieren und so automatisch weiter zu verarbeiten. Darüber hinaus bilden diese Verfahren die Grundlage für die weitergehende Auswertung und Bewertung von Texten durch maschinelles Lernen, etwa, wie im Produkt AFAIQ realisiert, zur Bonitätsbewertung auf der Grundlage von Jahresabschlüssen.
Highlights
- Informationsextraktion aus allen Dokumentarten
- Auswertung von layoutstrukturierten Dokumenten
- Keine Beschränkung auf immer ähnliche Formate
- Auswertung von Fließtexten