Gehring Group: Machine-Learning-Modell für Archivierungsdienstleister

Akten, Dokumente und Daten sind das Spezialgebiet der Gehring Group. Oder genauer: die professionelle Ablage und Archivierung dieser analogen und digitalen Unterlagen. Die Unternehmensgruppe mit Sitz in Oberhausen ist Archivierungsdienstleister und auf die Aktenlagerung sowie die Digitalisierung von Papieren spezialisiert. Die Klassifizierung der Dokumente soll in Zukunft mit Hilfe von Künstlicher Intelligenz optimiert und erleichtert werden. Den Grundstein dafür hat ein Transferprojekt mit Digital in NRW gelegt, das im April erfolgreich abgeschlossen wurde.

Klassifikation – automatisch statt manuell

fallen tagtäglich bei der Gehring Group an. Rechnungen. Aufträge. Lieferscheine. Arbeitsverträge. Schuldnerbriefe. Jedes einzelne dieser Papiere muss gescannt, klassifiziert und korrekt abgelegt werden. Das gilt auch für bereits digitalisierte Unterlagen. „Auch diese müssen nach Dokumentenklassen sortiert werden“, erklärt Maurice Vogel, wissenschaftlicher Mitarbeiter am Fraunhofer IML und Leiter des Transferprojekts von Digital in NRW. „Diese Sichtung geschieht aktuell zum großen Teil noch durch Mitarbeitende.“

Ein Arbeitsschritt, der mit hohem zeitlichen und personellen Aufwand verbunden ist und der zukünftig von einem KI-Verfahren abgelöst werden soll. „Die manuelle Klassifikation wird automatisiert“, so Maurice Vogel. „Alle Dokumente, die eingescannt werden oder sind, werden automatisch einer Klasse zugeordnet.“ Möglich machen soll das ein Machine-Learning-Modell, das im Rahmen des Transferprojekts entwickelt wurde. In vier Arbeitspaketen haben die Expert:innen von Digital in NRW die Software-Lösung konzipiert – immer im engen Austausch mit dem Unternehmen.

Trainingsdaten für den Algorithmus

Gemeinsam wurde ein Anwendungsfall definiert, Trainingsdaten erstellt. „Die Gehring Group hat uns rund 125.000 Dokumente übergeben“, erläutert Projektleiter Maurice Vogel. Diese waren das „Lernmaterial“ für den Algorithmus und das Machine-Learning-Modell, das von dem Projektteam entwickelt wurde. In der anschließenden Trainingsphase wurden die aufbereiteten Daten dem Algorithmus präsentiert, der mit jedem Dokument „dazulernt“. „Der Algorithmus lernt implizit“, so Maurice Vogel. „Er erkennt zum Beispiel das Wort Rechnung und den dazugehörigen Kontext. Dadurch, dass verschiedene Wörter in unterschiedlichen Kontexten stehen, kann die Software erfassen, welche Wörter typisch für ein Dokument sind.“ So entwickelt sich das Machine-Learning-Modell kontinuierlich weiter: mit jedem Dokument. Mit jedem neuen Wort in einem neuen Kontext.

Protoyp wird im Unternehmen integriert

Mittlerweile hat das Projektteam einen Prototypen konzipiert, der im Unternehmen integriert wird. Dort läuft die Anwendung dann auf dem Webserver. Erhält der Server neue Dokumente und Daten, werden diese automatisch klassifiziert – inklusive einer Angabe, wie zuverlässig diese Einteilung ist. „Die finale Prüfung der Zuordnung wird aktuell noch von Angestellten übernommen“, so Maurice Vogel. „Aber je länger das Modell läuft und weiterentwickelt wird, desto weniger wird auch das noch notwendig sein.“ Der Fachmann ist sich schon jetzt sicher, dass Gehring von dem KI-Modell profitieren wird: Die Zeitersparnis schaffe neue Ressourcen, um beispielsweise neue Dienstleistungen anzubieten – oder Mitarbeitende im Kundenservice statt in der Dokumentenklassifikation einzusetzen.

Mehrwerte für den Mittelstand

Doch auch andere Unternehmen können Mehrwerte aus dem Transferprojekt mitnehmen. Schließlich fallen in jedem Betrieb Dokumente an. „Dokumentenklassifikation ist ein großes Thema“, weiß Maurice Vogel. „Doch in vielen Unternehmen fehlen Know-how und Kapazitäten, um KI-Methoden zu entwickeln und zu etablieren.“ Umso wichtiger, wenn es dann Praxisbeispiele mit Vorbildfunktion gibt – wie das Transferprojekt von Digital in NRW und Gehring.