Anonymisierung von Dokumenten in der Justiz – Teil 1
Anonymisierung von Dokumenten in der Justiz
Erfordernis, rechtliche Grundlagen und technische Möglichkeiten
Ein Dokument wird anonymisiert, indem die enthalten personenbezogenen Daten entfernt oder durch Schwärzen/Weißen unkenntlich gemacht werden und damit der Personenbezug des so veränderten Dokuments aufgehoben wird. Im Unterschied zur Pseudonymisierung, bei der personenbezogene Daten durch dokumentierte Pseudonyme ersetzt werden, wird an die Anonymisierung der Anspruch gestellt, zumindest nach aktuellem Stand der Technik unumkehrbar zu sein. So bietet die vollständige Anonymisierung einen maximalen Schutz der personenbezogenen Daten, aber das Dokument verliert mit jeder Bearbeitung und Anonymisierung mehr an Informations- und Plausibiltätsgehalt.
Lesen Sie in unserer dreiteiligen Artikelserie, was Anonymisierung von Dokumenten ist und weshalb wir sie brauchen (Teil 1), welche rechtlichen Aspekte zu beachten sind (Teil 2) und wie die Anonymisierung von Dokumenten technisch erfolgen kann (Teil 3).
Teil 1: Warum brauchen wir die Anonymisierung von Dokumenten?
Sinn und Zweck der Anonymisierung von Dokumenten (und Daten) ist es, diese in einem Kontext zu nutzen, der nicht dem Erhebungszweck der in dem Dokument enthaltenen personenbezogenen Daten entspricht. Das ist besonders bei Softwareprojekten mit Nutzung von Künstlicher Intelligenz (KI) wichtig. Denn KI muss trainiert werden, und dazu bedarf es großer Mengen zur jeweils zu trainierenden Aufgabe oder Funktion passender Daten. Wie wichtig es ist, dass diese Daten den Datenschutzanforderungen genügen und deshalb keine personenbezogenen Informationen enthalten, wird an Forschungsergebnissen deutlich, die zeigen, dass personenbezogene Daten wie zum Beispiel Bilder von Personen, die zum Training einer KI genutzt wurden, rekonstruiert werden konnten. Systeme wie ChatGPT können personenbezogene Daten wiedergeben, wenn diese vorher zum Training genutzt wurden.
Für das Training einer KI ist es daher essenziell, anonymisierte Daten zu verwenden, es sei denn, man hätte vorher die Einwilligung der Betroffenen eingeholt. Angesichts der zum Training einer KI erforderlichen großen Datenmengen wäre das (nachträgliche) Einholen der Einwilligung aufwendig und zeitintensiv. Es bleibt also nur der Weg der Anonymisierung.
Im Bereich der Justiz ist diese Form der Nutzung von Daten nicht weniger relevant als in vielen anderen Bereichen von Wirtschaft und Gesellschaft. Ein Beispiel: die Anonymisierung von Gerichtsentscheidungen.
Gerichtsentscheidungen, an denen ein öffentliches Interesse besteht, müssen grundsätzlich veröffentlicht werden. Die aktuelle Rate der Veröffentlichungen liegt jedoch nur bei 2-5%, was zum einen an der Abwägung liegt, ob man bei einer Entscheidung von einem öffentlichen Interesse ausgehen kann, und zum anderen an der aufwendigen manuellen Anonymisierung. Anonymisierte Gerichtsurteile sind aber nicht nur für die Veröffentlichung nutzbar, sondern können auch als Basis für das Training einer textbasierten KI dienen. Besonders deutsche Rechtstexte sind nämlich in der KI-gestützten Sprachverarbeitung unterrepräsentiert und bieten damit keine ausreichende Unterstützung für Jurist:innen.
Lesen Sie Teil 2: Rechtliche Grundlagen der Anonymisierung von Dokumenten