(c) Inaki del Olmo on Unsplash <a style="background-color:black;color:white;text-decoration:none;padding:4px 6px;font-family:-apple-system, BlinkMacSystemFont, &quot;San Francisco&quot;, &quot;Helvetica Neue&quot;, Helvetica, Ubuntu, Roboto, Noto, &quot;Segoe UI&quot;, Arial, sans-serif;font-size:12px;font-weight:bold;line-height:1.2;display:inline-block;border-radius:3px" href="https://unsplash.com/@inakihxz?utm_medium=referral&amp;utm_campaign=photographer-credit&amp;utm_content=creditBadge" target="_blank" rel="noopener noreferrer" title="Download free do whatever you want high-resolution photos from Iñaki del Olmo"><span style="display:inline-block;padding:2px 3px"><svg xmlns="http://www.w3.org/2000/svg" style="height:12px;width:auto;position:relative;vertical-align:middle;top:-2px;fill:white" viewBox="0 0 32 32"><title>unsplash-logo</title><path d="M10 9V0h12v9H10zm12 5h10v18H0V14h10v9h12v-9z"></path></svg></span><span style="display:inline-block;padding:2px 3px">Iñaki del Olmo</span></a>
Author profile picture

Informatikerinnen an der Universität Wien haben eine neue Text Mining Software entwickelt, die Anwendern einen raschen Überblick über Gesetztestexte gibt. Damit sollen vor allem Unternehmen bei der Umsetzung von neuen regulatorischen Vorgaben unterstützt werden.

Die 2018 eingeführte Datenschutzgrundverordnung (DSGVO) zeigte, wie fordernd der Umgang mit gesetzlichen Regulatorien sein kann. Alle waren davon betroffen – Vereine, Firmen und Private – und alle hatten das gleiche umfangreiche Bündel an Informationen, aus dem sie sich mühsam die jeweils zutreffenden Informationen filtern mussten.

Vereinfachung von Arbeit

In Unternehmen ist diese Situation wiederkehrend. Das Prüfen von juristischen Dokumenten kostet Zeit und Ressourcen, die eigentlich nicht vorhanden sind. Die Informatikerin Stefanie Rinderle-Ma beschäftigt sich schon seit Jahren mit dem Thema. Sie forscht an der Fakultät für Informatik an der Schnittstelle von Wissenschaft und unternehmerischer Praxis. Der Fokus liegt auf der Unterstützung und Vereinfachung von Arbeit.

“Gerade am Anfang, wenn eine neue Regelung kommt, ist oft unklar, was genau geschehen muss. Alle lesen sich ein und interpretieren (…)”, sagt Rinderle-Ma.

Neuer Ansatz

In ihrer Forschungsgruppe Research Group Workflow Systems and Technology entwickelte und realisierte sie gemeinsam mit der Nachwuchsforscherin Karolin Winter eine neue Text Mining-Methode. Diese ermöglicht es den Anwendern, automatisch relevante Informationen aus den Texten zu ziehen. „Benutzer wollen sich schnell einen Überblick verschaffen oder – wenn sich Regelungen ändern – unterschiedliche Textdokumente unkompliziert vergleichen”, so die Wissenschafterinnen.

Neu an dem Verfahren ist die Aufbereitung des Dokuments. Die ursprüngliche Struktur der eingespeisten Dokumente wird aufgelöst und ermöglicht so den Vergleich von Regeln und Textabschnitten. Das war zuvor nicht möglich. Darüberhinaus kann Text Mining erstmals auf komplex strukturierte Einzeldokumente angewendet werden.

Textmenge reduzieren

Das Programm filtert die Texte wie eine Suchmaschine nach Themen oder angesprochenen Personengruppen und Organisationen. Für eine Firma sind zum Beispiel Informationen, die sich an Nationalstaaten richten, uninteressant. Die an Firmen gerichteten Informationen sind aber über das gesamte Dokument verteilt und damit schwer erfassbar. Das Text Mining-Verfahren ermöglicht eine Strukturierung, die irrelevanten Inhalt ausblendet und so den Leseaufwand deutlich reduziert.

Auch wer nachlesen möchte, in welchem Zusammenhang eine Regel beschrieben wird, braucht das Dokument nicht zu durchsuchen. Das Programm markiert die jeweils relevanten Sätze und verlinkt diese mit den entsprechenden Textstellen im Dokument.

Will sich ein Anwender zu einem Thema informieren, lassen sich Textabschnitte gruppieren und geben so rasch einen Überblick. Selbst Textstellen aus mehreren verschiedenen Texten lassen sich auf diese Weise gleichzeitig bearbeiten.

Textstellen vergleichen

Darüberhinaus bietet das neue Verfahren auch die Möglichkeit des Vergleichs: In Dokumenten befinden sich oft ähnliche Passagen. Diese werden vom Programm gekennzeichnet und zusammengefasst. Anwender können diese nacheinander durchsehen und vergleichen. Dabei werden auch Konflikte angezeigt. Das erleichtert ein rasches Erkennen von widersprüchlichen Regeln und Veränderungen von einer früheren Version des Dokuments zur nächsten.

Nach dem erfolgreichen Abschluss des Projekts forschen die Informatikerinnen jetzt nach weiteren Anwendungsmöglichkeiten in Wirtschaft und Wissenschaft. Die Methode soll kontinuierlich erweitert werden, um auch in anderen Bereichen eine Dämmung der alltäglichen Textflut zu ermöglichen. Ein Beispiel ist der Papierkram, der unter anderem im Pflegebereich anfällt. Laut Rinderle-Ma zeichne sich eine Reduktion des Zeitaufwands um etwa sechzig Prozent ab – und das bei gleichzeitiger Steigerung der Qualität, weil stets alle Verpflichtungen gegenwärtig sind. Ähnlich schätzt sie den Leseaufwand für regulatorische Dokumente ein, der sich deutlich reduziert, wenn der Text thematisch strukturiert werden kann.

Das Projekt läuft unter der Bezeichnung CRISP und wurde vom Wiener Wissenschafts-, Forschungs- und Technologiefonds (WWTF) gefördert und läuft noch bis Ende des Jahres.

 

Auch interessant:

Die DSGVO im Einsatz – wie ihre Daten geschützt werden

Künstliche Intelligenz weiter auf dem Vormarsch

Ein diskreter und präziser Navigations-Assistent vom Geo-Informatiker

Retorio trainiert die Rhetorik