Title
LG Hamburg: Erstellung von KI-Trainingsdaten als zulässiges Text und Data Mining
- Das Herunterladen und Analysieren urheberrechtlich geschützter Bilder zur Erstellung eines KI-Trainingsdatensatzes kann Text und Data Mining im Sinne des § 44b UrhG darstellen.
- Bereits die Erstellung eines für das KI-Training nutzbaren Datensatzes kann als wissenschaftliche Forschung im Sinne des § 60d UrhG anzusehen sein, wenn sie mit dem Ziel erfolgt, den Datensatz zum späteren Erkenntnisgewinn einzusetzen.
- Stellt eine Forschungsorganisation den erstellten Datensatz kostenfrei öffentlich zur Verfügung, spricht dies für eine nicht-kommerzielle Zweckverfolgung im Sinne des § 60d Abs. 2 Satz 2 Nr. 1 UrhG.
- Die Anwendbarkeit des § 44b UrhG für gewerbliche KI-Anwendungen ist umstritten. Rechtsicherheit wird wohl erst bestehen, wenn der EuGH diese Frage abschließend geklärt hat.
Mit der rasanten Entwicklung Künstlicher Intelligenz stellen sich zunehmend auch urheberrechtliche Fragen. Eine zentrale Rolle spielt dabei die Erstellung von Datensätzen für das Training von KI-Systemen. Das Landgericht Hamburg hat sich nun in einem wegweisenden Urteil mit der Frage befasst, inwieweit solche KI-Trainingsdatensätze von den Schrankenregelungen für Text und Data Mining erfasst sind.
Zum Hintergrund
Das Urheberrechtsgesetz sieht in den §§ 44a ff. UrhG Schrankenregelungen vor, die bestimmte Nutzungen urheberrechtlich geschützter Werke auch ohne Zustimmung des Rechteinhabers erlauben. § 44b UrhG privilegiert dabei Vervielfältigungen von geschützten Werken für das sogenannte Text und Data Mining, also die automatisierte Analyse von Werken, um daraus Informationen zu gewinnen. § 60d UrhG erweitert die Nutzung solcher Vervielfältigungen für Zwecke der nicht-kommerziellen wissenschaftlichen Forschung.
Im konkreten Fall hatte ein gemeinnütziger Verein einen umfangreichen Datensatz mit Bild-Text-Paaren erstellt, der zum Training von KI-Systemen genutzt werden kann. Dazu hatte der Verein u.a. eine urheberrechtlich geschützte Fotografie heruntergeladen und analysiert. Der Urheber des Fotos sah darin eine Urheberrechtsverletzung.
Auswirkungen auf die Praxis
Das LG Hamburg hält die Vervielfältigung des Fotos aufgrund der Schrankenregelung des § 60d UrhG für gerechtfertigt. Denn der Verein habe den Datensatz zu Zwecken der wissenschaftlichen Forschung erstellt und verfolge mit der kostenlosen Veröffentlichung keine kommerziellen Zwecke.
Damit stellt das Gericht klar, dass bereits die Erstellung von KI-Trainingsdatensätzen als solche wissenschaftliche Forschung darstellen kann, selbst wenn der unmittelbare Erkenntnisgewinn erst in einem späteren Schritt erfolgt. Entscheidend ist die Zweckrichtung der Erstellung.
Dass solche Datensätze später auch von kommerziellen Unternehmen zum Training ihrer KI-Modelle genutzt werden, ist laut Gericht unschädlich, solange die erstellende Organisation selbst nicht-kommerzielle Zwecke verfolgt. Personelle Verflechtungen zwischen Verein und Unternehmen genügen nicht, um einen bestimmenden Einfluss im Sinne des § 60d Abs. 2 Satz 3 UrhG zu begründen.
Fazit
Das Urteil des LG Hamburg schafft mehr Rechtssicherheit für Forschende, die KI-Trainingsdatensätze erstellen wollen. Es zeigt, dass die urheberrechtlichen Schrankenregelungen durchaus Raum für die Entwicklung Künstlicher Intelligenz lassen, solange wissenschaftliche und nicht-kommerzielle Zwecke im Vordergrund stehen. Gleichzeitig bleibt die Anwendbarkeit des § 44b UrhG auf gewerbliche KI-Anwendungen umstritten und wird wohl erst durch weitere Gerichtsentscheidungen geklärt werden. Rechteinhaber sollten daher weiterhin klare Nutzungsvorbehalte formulieren, um ihre Interessen zu wahren.
Haben Sie Fragen oder Anmerkungen? Sprechen Sie uns gerne an.