Künstliche Intelligenz (KI) und Urheberrecht

Künstliche Intelligenz (KI), Machine Learning und neuronale Netze – Immer wenn Sie selbstlernende Systeme einsetzen, kommen an verschiedenen Stellen Fragen des Urheberrechts auf. Unser Ratgeber gibt Ihnen einen Überblick, was Sie beachten müssen – vom Umgang mit den Trainingsdaten bis zur Vermarktung Ihrer Software.

Warum spielt das Urheberrecht eine Rolle?

Die Urheber und schutzfähige Werke

Bei Urheberrecht gilt das Territorialprinzip: Jeder Staat kann sich sein eigenes Urheberrecht geben und bestimmen, in welchem Umfang er geistige Schöpfungen schützt und welche Rechte ein Urheber haben soll. Deutschland hat diese Fragen im Urheberrechtsgesetz (UrhG) geregelt. Danach kann eine personliche geistige Schöpfung als Werk geschützt werden, wenn der Schöpfer eine hinreichende Schöpfungshöhe erreicht und seine Schöpfung in wahrnehmbarer Form verkörpert. Computerprogramme sind nach § 2 Abs. 1 UrhG ausdrücklich schutzfähig. Urheber ist in der Regel, wer den Quellcode verfasst hat.

Bei KI-Software, insbesondere wenn sie auf Machine Learning zurück geht, wird das Urheberrecht an mehreren Stellen relevant:

bei den Trainingsdaten
bei der fertig trainierten Software
beim Output der Software

Die Nutzung der geschützten Werke

Wenn ein Werk urheberrechtlichen Schutz genießt, bestimmt das Urheberrecht, wer was mit diesem Werk tun darf.

Der Urheber selbst darf grundsätzlich mit seinem Werk tun, was er möchte: Er darf es z.B. vervielfältigen, verbreiten, öffentlich wiedergeben und zugänglich machen, bearbeiten, umgestalten und kommerziell nutzen.

Wer kein Urheber ist, darf nur solche Handlungen vornehmen, die das Urheberrecht besonders erlaubt oder die nicht vom Urheberrecht geregelt werden. Zu den urheberrechtlich nicht relevanten Handlungen gehört der reine Werkgenuss, also etwa das Betrachten eines Bildes, das Anhören von Musik oder das Lesen von Texten – denn das Werk wurde genau zu diesen Zwecken geschaffen.

Wer Handlungen vornehmen möchte, die dem Urheber vorbehalten sind, benötigt dafür entsprechende Nutzungsrechte – also eine Lizenz. Solche kann der Urheber selbst oder ein dazu berechtigter Nutzungsrechtsinhaber einräumen. Wenn Sie ein Software-Abo abschließen erwerben Sie die Lizenz gegen Entgelt, bei der Nutzung von Open Source Quellcode ist die Lizenz in der Regel kostenlos. Der Urheber kann als Lizenzgeber bestimmen, welche Nutzungen er erlaubt, also was Sie mit dem Werk tun dürfen. Das Urheberrecht ist hier streng: bereits das Kopieren oder Laden von Software ist eine dem Urheber vorbehaltene Handlung.

Die Urheber oder Inhaber von ausschließlichen Nutzungsrechten können die unberechtigte Nutzung ihrer Werke verbieten. Sie haben Ansprüche auf Unterlassung, Auskunft und Schadensersatz gegen diejenigen, die ihre Werke ohne entsprechende Lizenz nutzen. Manche Verstöße gegen das Urheberrechtsgesetz sind sogar strafbar.

Urheberrecht bei den KI-Trainingsdaten

Was passiert beim Training?

Es gibt unterschiedliche Arten des Machine Learning (z.B. überwachtes, unüberwachtes, teilüberwachtes, verstärkendes Lernen oder Deep Learning), die für die urheberrechtliche Betrachtung aber alle eine Gemeinsamkeit haben. Vereinfacht dargestellt verrechnet ein Machine Learning Algorithmus Daten und berechnet daraus ein Ergebnis. Im nächsten Schritt wird der Algorithmus automatisch angepasst, je nachdem wie wünschenswert dieses Ergebnis war. Die Anpassung geschieht häufig mit Zufallselementen. Diese Schritte werden häufig und mit vielen verschiedenen Daten wiederholt, bis die Ergebnisse des Algorithmus im Durchschnitt sehr wünschenswert sind.

In manchen Fällen ist es denkbar, Systeme gänzlich ohne bereits vorhandene Datensätze zu trainieren. Das ist z.B. der möglich, wenn zwei KI-Softwareteile bereits mit den Regeln eines Brettspiels programmiert wurden, gegeneinander spielen und daraus lernen (z.B. Googles AlphaGo Zero).

In vielen Fällen wird die Software anhand von bestehenden Datensätzen trainiert. Dabei kommen je nach Anwendungsfall praktisch alle Arten von Daten in Betracht. Eine Gesichtserkennungssoftware wird z.B. mit Fotografien oder Videos trainiert, eine Spracherkennungssoftware mit Audiodateien mit Skript, eine Übersetzungssoftware mit Formulierungsbeispielen samt Übersetzung, eine Bildanmerkungssoftware mit Bildern und Anmerkungen und ein Chatbot mit Chat- oder Gesprächsprotokollen. Der Phantasie sind hier kaum Grenzen gesetzt.

Diese Datensammlungen werden Trainingsdaten (englisch dataset, manchmal auch Schulungsdaten oder Korpus) genannt. Je mehr korrekte und geeignete Trainingsdaten vorhanden sind, je größter also der Datensatz ist, desto besser kann die KI trainiert werden und desto besser kann die Software als fertiges Produkt werden. Wie viele Trainingsdaten notwendig sind, um eine bestimmte Software hinreichend zu trainieren lässt sich kaum vorhersagen und hängt von vielen Faktoren ab. Eine Rolle spielt z.B., ob die Daten strukturiert oder unstrukturiert sind, wie sie gekennzeichnet sind, mit welcher Methode sie dem System zugeführt werden und ob sie von Duplikaten und Rauschen, etc bereinigt wurden.

Das Beschaffen und Aufbereiten der Trainingsdaten

Schutzfähigkeit der Trainingsdaten

Trainingsdaten sind nicht in allen Fällen urheberrechtlich geschützt. Gemeinfreie und nicht schutzfähige Daten können ohne die Schranken des Urheberrechts als Trainingsdaten genutzt werden.

Oft sind die Trainingsdaten selbst urheberrechtlich schutzfähig, insbesondere wenn es sich um Sprachwerke, Musikdateien, Lichtbilder, Filmwerke, Zeichnungen, Pläne, Karten, Skizzen, Tabellen und Datenbanken handelt. Diese Arten von Daten können bei entsprechender geistiger Schöpfungshöhe nach §§ 2, 4 UrhG urheberrechtlichen Schutz genießen.

Wann wird das Urheberrecht berührt?

Wenn die Trainingsdaten urheberrechtlichen Schutz genießen, liegen schon in der Vorbereitung des Trainings mehrere urheberrechtsrelevante Handlungen. Insbesondere kommt es in diesen Fällen zu Vervielfältigungen, die nach § 16 UrhG dem Urheber vorbehalten sind:

Download und Speicherung der Daten
Konvertierung, Standardisierung und Normierung der Daten, sodass die KI sie verwenden kann
Aufnahme der Daten in eine Datenbank

Das Urheberrechtsgesetz selbst kennt für das Text und Data Mining (TDM) nur enge Ausnahmen in § 44b UrhG und § 60d UrhG, insbesondere wenn es um die Erkennung von Mustern, Trends und Korrelationen oder die Auswertung zu wissenschaftlichen Zwecken geht. Eine breite kommerzielle Verwertung ist danach nicht erlaubt und das Zusammenstellen der Trainingsdaten unterliegt den allgemeinen Regeln.

Wie beschafft man rechtmäßig Trainingsdaten?

In fast allen denkbaren Bereichen sind Daten in großer Fülle vorhanden und zugänglich, insbesondere im Internet. Der Gedanke mag sympathisch sein, einfach tausende YouTube-Videos oder Pinterest-Fotos zum Training einer Gesichtserkennungssoftware automatisiert herunterzuladen und zu verwenden. Vertragliche Nutzungsvereinbarungen und der urheberrechtliche Schutz verhindern aber häufig oft die gewünschte Nutzung.

Im Zweifel sollten Sie für jede einzelne Trainingsdatei klären, ob Sie zur Nutzung für das Training berechtigt sind.

Gemeinfreie Werke

Manche Werke sind gemeinfrei und unterfallen nicht oder nicht mehr dem urheberrechtlichen Schutz. Das Urheberrecht erlischt grundsätzlich 70 Jahre nach dem Tod des Urhebers (§ 64 UrhG), Lichtbilder 50 Jahre nach ihrem Erscheinen (§ 72 UrhG) und Datenbanken 15 Jahre nach Veröffentlichung oder Herstellung (§ 87d UrhG).

Amtliche Werke wie Gesetze und Bekanntmachungen unterfallen von vornherein nicht dem Urheberrecht (§ 5 UrhG). Das gleiche gilt für Werke, denen die erforderliche Schöpfungshöhe fehlt oder die keine geistige Schöpfung sind, weil kein Mensch an ihrer Erstellung mitgewirkt hat (siehe unten).

Im deutschen Recht kann ein Urheber nicht einseitig auf sein Urheberrecht verzichten. Solche Versuche sind häufig als Einräumung von Nutzungsrechten nach einer permissiven Lizenz umzudeuten. In anderen Rechtsordnungen, wie z.B. in den USA kann ein Urheber auf sein Copyright verzichten und die Werke in die Public Domain überführen.

Achtung: Anbieter, die gemeinfreie Werke zusammentragen und in einer Sammlung z.B. online präsentieren, sind in der Regel zumindest als Datenbankhersteller geschützt.

permissive licenses

Im manchen Fällen werden urheberrechtlich geschützte Werke unter Lizenzen angeboten, die eine Nutzung als Trainingsdaten erlauben können.

Moderne freie Lizenzen erlauben die Nutzung der lizenzierten Inhalte zu nahezu allen Zwecken. So erlauben z.B. die CC-Lizenzen in der aktuellen Version 4 die Nutzung für KI-Training. Bei den CC NC-Lizenzen ist jedoch eine kommerzielle Nutzung ausgeschlossen.

Auch bei einem kostenlosen Angebot räumen Anbieter keine unbeschränkten Nutzungsrechte ein. YouTube z.B. regelt die Lizenz für die Nutzer ihrer Plattform in den Nutzungsbedingungen. Dort werden die zum Abspielen der Videos erforderlichen Rechte nur eingeräumt, soweit das zur Nutzung der Website nötig ist:

Lizenz an andere Nutzer

Sie gewähren auch jedem anderen Nutzer des Dienstes das weltweite, nicht-exklusive, kostenfreie Recht, im Rahmen des Dienstes auf Ihre Inhalte zuzugreifen und diese nutzen zu können (einschließlich der Vervielfältigung, Verbreitung, Änderung, Anzeige und Wiedergabe, jeweils unter Beachtung der Urheberpersönlichkeitsrechte), soweit dies erforderlich ist und durch Funktionen des Dienstes ermöglicht wird.
YouTube Nutzungsbedingungen, Stand: 20.05.2022

Das Anschauen ist erlaubt. Das Herunterladen und kommerzielle verwerten für KI-Training nicht. Etwas anderes kann gelten, wenn der Kanalinhaber das Video unter eine CC-BY-Lizenz stellt.

Selbst erzeugen

Ob Softwareentwickler ihre Trainingsdaten in der benötigten Menge selbst erzeugen können, hängt von der Art der benötigten Daten ab.

Das kann möglich sein bei Daten, die keinen Bezug zur physischen Welt haben müssen, etwa Spielabläufe zum Training von Bots für Computerspiele, Schach-Positionen zum Training von Schachcomputern oder Zufallsdaten. Sobald die Trainingsdaten aber nicht mehr durch Software erzeugt werden können, ist es oftmals wirtschaftlich nicht mehr vertretbar, sie in der physischen Welt zu sammeln.

Manche Daten können nur nach größeren wirtschaftlichen Investitionen erzeugt werden, die Einzelpersonen in der Regel nicht möglich sind. Das sind z.B. Kartografien oder Satellitenbilder zum Training von Navigationssoftware.

Manche große Anbieter verfügen von Haus aus schon nach ihrem Geschäftsmodell über riesige Datenmengen, die zum Training von KI verwendet werden könnten. Dazu gehören insbesondere große Social Media Plattformen, Suchmaschinen, Videoplattformen und Datenbankbetreiber. Wenn die Daten dieser Unternehmen urheberrechtlich geschützt sind, hängt die Möglichkeit zur Nutzung als Trainingsdaten unter anderem davon ab, ob die Kunden oder Nutzer entsprechende Rechte eingeräumt haben.

YouTube und Yahoo regeln für hochgeladene Videos und Inhalte z.B.:

Lizenz an YouTube

Durch das Einstellen von Inhalten in den Dienst räumen Sie YouTube und seinen verbundenen Unternehmen (unter anderem YouTube LLC, Google LLC und Google Commerce Limited) das weltweite, nicht-exklusive, kostenfreie Recht ein, diese Inhalte zu nutzen (einschließlich ihres Hosting, ihrer öffentlichen Zugänglichmachung, Vervielfältigung, Verbreitung, Änderung, Anzeige und Wiedergabe, jeweils unter Beachtung der Urheberpersönlichkeitsrechte), ausschließlich zum Zweck der Erbringung und Verbesserung des Dienstes (auch durch die Inanspruchnahme von Dienstleistern) und lediglich in dem dafür nötigen Umfang.
YouTube Nutzungsbedingungen, Stand: 20.05.2022

Rechte an geistigem Eigentum und Lizenzerteilung. Wenn nicht in den speziellen Bedingungen für Produkte oder Richtlinien für einen unserer Dienste anders angegeben, bleiben Sie Inhaber aller geistigen Eigentumsrechte, die Sie an Inhalten besitzen, die Sie in die Dienste hochladen, dort teilen oder zur Verfügung stellen. Sie erteilen uns eine weltweite, gebührenfreie, nicht-exklusive, zeitlich unbegrenzte, unwiderrufliche, übertragbare und unterlizenzierbare Lizenz, Ihre Inhalte in jeglicher Weise, Bereitstellungsform und in jedem Medium, gleichgültig ob derzeit bekannt oder unbekannt, (a) zu nutzen, hosten, speichern, reproduzieren, modifizieren, abgeleitete Werke (wie Übersetzungen, Bearbeitungen, Zusammenfassungen und sonstige Änderungen) zu erstellen, sie zu kommunizieren, zu veröffentlichen, öffentlich aufzuführen, öffentlich darzustellen und zu vertreiben (…).
Yahoo Nutzungsbedingungen, 6.b., Stand: 20.05.2022

Für solche Anbieter stellen sich andere Fragen bei der Verwertung – insbesonders zum Datenschutz.

Trainingsdaten kaufen

Wenn nicht genügend nutzbare Trainingsdaten zur Verfügung stehen kann man an die jeweiligen Urheber oder deren Verwertungsgesellschaften herantreten und oft gegen Entgelt eine Lizenz erwerben, die die Nutzung zum gewünschten Training erlaubt. Das ist aber häufig mit einer aufwändigen Suche nach den richtigen Urhebern und mit Vertragsverhandlungen verbunden. Je mehr Werke man in seine Trainingsdaten mit aufnehmen möchte, desto wirtschaftlich unattraktiver ist dieser Weg.

Diese Schwierigkeit lösen Anbieter, die kommerziell ganze Packs mit Tausenden oder Millionen von Werken als fertige Trainingsdaten anbieten. Diese Anbieter können Datensätze individuell nach den Bedürfnissen der KI zusammenstellen und garantieren häufig, dass die Daten die erforderliche Qualität aufweisen. Solche Anbieter haben sich im Vorfeld um entsprechende urheberrechtliche Nutzungsrechte gekümmert, also die Daten erworben oder rechtssicher bezogen. Manche bieten auch an, Daten für den Kunden individuell im gewünschten Format zu erzeugen. Der Kunde spart sich so in der Regel die lästige Urhebersuche und Lizenzrecherche.

Das Trainieren der KI-Software

Beim Trainieren der KI ruft die Software die Trainingsdaten auf und errechnet nach dem gewählten Algorithmus einen bestimmten Wert zu allen einzelnen Daten. Anhand dieses Wertes wird die Fitness des Algorithmus errechnet. Diese bloße Auswertung und Analyse der Daten ist in der Regel keine urheberrechtsrelevante Handlung (vgl. Bundesrat Drucksache 312/17, S. 40). Diese Handlungen gehört zum bestimmungsgemäßen Werkgenuss (wie das Betrachten eines Bildes).

Beim Trainieren der Software an sich ist der Anwendungsbereich des Urheberrechtsgesetzes in der Regel also nicht eröffnet.

Testdaten

Neben den Trainingsdaten werden beim Machine Learning oft auch noch Testdaten verwendet. Diese werden idealerweise aus dem Pool der ursprünglichen Trainingsdaten entnommen und nicht fürs Training genutzt. Sie sind dafür reserviert, die Funktionalität der fertigen Software oder deren Zwischenversionen mit unbekannten Daten zu prüfen, die noch nicht durch das Training in den aktuellen Softwarestand eingeflossen sind.

Bei der Verwendung der Testdaten stellen sich dieselben urheberrechtlichen Probleme, wie bei den Trainingsdaten.

Die traininerte Software

Die trainierte Software selbst ist ein Computerprogramm, das das Urheberrecht nach § 2 Abs. 1 Nr. 1 UrhG und §§ 69a ff. UrhG ausdrücklich schützt, wenn es aus einer hinreichenden persönliche geistigen Schöpfung hervorgeht. Die Software besteht nicht nur aus den im Rahmen des Machine Learning selbständig optimierten Algorithmen, sondern geht in der Regel zum größten Teil auf menschlich geschaffenen Source Code zurück.

Etwas anderes kann für Algorithmen und Software gelten, die sich durch Machine Learning selbständig weiterentwickeln, die sozusagen die Schöpfung einer Software selbst sind (siehe unten).

Ungeklärt ist die Frage, ob eine Software, die mit urheberrechtswidrig zusammengestellten Trainingsdaten trainiert wurde, selbst gegen das Urheberrecht verstößt. Im U.S.-Recht hat etwa die Federal Trade Commission (FTC) als Aufsichtsbehörde die Möglichkeit, die Zerstörung von Algorithmen zu verlangen, die auf eine rechtswidrige Nutzung von Daten zurückgehen. Dieses umstrittene algorithmic disgorgement oder alogithmic destruction wurde im Zuge erstmals 2019 medienträchtig von Cambridge Analytica verlangt.

Urheberrecht an den Ergebnissen und Erzeugnissen der KI-Software

Vorab: Der Gesetzgeber reagiert in der Regel langsam auf technische Neuerungen. Künstliche Intelligenz und die Fragen, die sich in diesem Zusammenhang beim Urheberrecht stellen, sind für ihn deswegen eine vergleichsweise neue Erscheinung. Aktuell gibt es noch kein Gesetz, was sich spezifisch mit den Fragen des Urheberrechts an den Erzeugnissen von künstlicher Intelligenz beschäftigt.

Der Output von KI-Technologien

KI-Software kann mittlerweile Bilder, Musik, Designs und andere Werke erzeugen, die bei einer Erzeugung durch einen Menschen die Schöpfungshöhe erreicht hätten, die für einen urheberrechtlichen Schutz erforderlich wäre. In vielen Bereichen stehen die Erzeugnisse von KI-Software den menschlichen Werken in nichts nach. Mit anderen Worten: man kann nicht erkennen, ob ein Mensch oder eine Maschine hinter dem Werk steht.

Genauso wie die Urheber solcher Werke ein Interesse an urheberrechtlichem Schutz haben, sind die Softwareentwickler, Betreiber oder Nutzer solcher KI-Software daran interessiert, dass die Erzeugnisse der Software irgendwie geschützt werden.

Urheberrechtlicher Schutz

Das deutsche Urheberrecht passt für den Output von KI-Software nicht und schützt diesen mit wenigen Ausnahmen nicht.

Wer als Urheber in Betracht kommt

Software selbst ist juristisch gesprochen kein Rechtssubjekt. Das heißt, Software kann nicht Inhaber von Rechten sein. Genauso wenig wie Tiere, obwohl das Recht sie an einigen Stellen (z.B. im Tierschutzgesetz) schützt. Das ergibt sich aus der Systematik der deutschen Gesetze und bedeutet für das Urheberrecht, dass eine Software nicht selbst Urheber sein kann. Wenn eine Software so komplex wird, dass sie ein mit den Menschen vergleichbares eigenes Bewusstsein entwickelt, wird diese eher gesellschaftspolitische Frage (auch Robot Rights genannt) wahrscheinlich neu gestellt werden.

Als Urheber für den Output von KI-Software kommen verschiedene Personen in Betracht:

Die Urheber (Softwareentwickler) oder Nutzungsrechtsinhaber der KI-Software
Die Entwickler oder Trainer des selbstlernenden Algorithmus
Die Inhaber der Trainingsdaten
Die Investoren
Die Urheber oder Nutzungsrechtsinhaber der KI-Software
Die Eigentümer des ausführenden Computers
Die Nutzer der KI-Software

Die weite Gruppe der Hersteller (z.B. Softwareentwickler der KI-Software, Entwickler oder Trainer des selbstlernenden Algorithmus, Inhaber der Trainingsdaten) der KI-Software kommen als mögliche Urheber nicht in Betracht. Würde man ihnen jedes durch die KI-Software erzeugte Werk urheberrechtlich zuordnen, würde der urheberrechtliche Schutz stark ausufern. Diese Betrachtung ist vergleichbar mit dem Softwareentwickler eines Bildbearbeitungsprogramms, der nicht Urheber aller bearbeiteten Bilder werden würde.

Auch die Eigentümer der Infrastruktur, wie z.B. des ausführenden Computers, und die Investoren kommen nicht als Urheber in Frage. Diese haben selbst keine Arbeit zur Schaffung des jeweiligen Werks geleitet und keinen Einfluss darauf genommen.

Am nähesten an der Schaffung des jeweiligen Werks stehen die Nutzer der Software, die je nach Ausgestaltung zumindest auswählen, auf Basis welcher Daten der Output der Software erzeugt wird. Problematisch für die Entstehung eines Urheberrechts ist, dass auch bei den Nutzern oft keine persönliche geistige Schöpfung vorliegt (siehe unten).

Persönliche geistige Schöpfung

Urheberrechte können nur an Werken entstehen, an deren Erstellung Menschen mitgewirkt haben. Andernfalls liegt keine „persönliche geistige Schöpfung“ vor, die das Gesetz fordert.

Werke im Sinne dieses Gesetzes sind nur persönliche geistige Schöpfungen.
§ 2 Abs. 2 UrhG

Wie bei Delfinen, die mit dem Pinsel malen, oder Affen, die ein Selfie schießen, besteht kein urheberrechtlicher Schutz, wenn keine menschliche Schöpfung vorliegt. Das, obwohl solche Kreationen einen hohen wirtschaftlichen Wert haben können. Dasselbe gilt für Kreationen, die eine Maschine oder Software eigenständig produziert.

Für eine urheberrechtliche Schutzfähigkeit muss der geistige Schöpfungsvorgang unmittelbar zum jeweiligen Ergebnis führen. Wenn man weit genug zurückblickt, geht jede Software auf einen oder mehrere Menschen zurück (die Programmierer oder Nutzer). Die Programmierleistung, also das Verfassen des Quellcodes, führt aber in aller Regel nicht unmittelbar zum jeweiligen Ergebnis, das die Software schließlich nach dem Training produziert. Das gilt insbesondere, wenn das Ergebnis der Software nicht vorhergesagt werden kann.

Wenn ein Mensch die Software aber nur als Hilfsmittel nutzt, kann das Erzeugnis unter Umständen unmittelbar auf eine menschliche Schöpfung zurückgeführt werden. Dann sind Urheberrechte denkbar. Ein Beispiel dafür ist Bildbearbeitungssoftware, mit der der Nutzer gezielt bestimmte Effekte erzeugen kann, oder Audiosoftware, mit der der Nutzer etwa eine Stimme verzerren kann. In diesen Fällen kann das Ergebnis der Nutzung der Software (hier des Grafik- oder Soundeffekts) in etwa vorhergesagt werden. Das spricht dafür, dass eine menschliche Schöpfung vorliegt. Hier kommt es aber immer auf den Einzelfall an.

Wenn ein urheberrechtlich nicht geschütztes Werk händisch weiterbearbeitet wird, kann an dieser Bearbeitung nach normalen Grundsätzen ein Urheberrecht entstehen.

Weitere Schutzrechte

Werke, die die für das Urheberrecht erforderliche Schöpfungshöhe nicht erreichen, denen aber trotzdem eine Investitionsleistung zugrunde liegt, können durch andere verwandte Schutzrechte (sogenannte Leistungsschutzrechte) geschützt sein.

Bilder, die keine Lichtbildwerke sind (z.B. reine Schnappschüsse), können als einfache Lichtbilder (§ 72 UrhG) geschützt sein. Dieser Schutz erwirbt der Fotograf oder zumindest derjenige, der bei automatischen Aufnahmen die Einzelheiten der Aufnahme festlegt. Bilddateien, die rein digital ohne Nutzung strahlender Energie erzeugt werden, fallen jedoch nicht darunter. Wenn eine KI-Software Bilder eigenständig produziert, ist ein Lichtbildschutz dafür ausgeschlossen.

Das Gleiche gilt für Laufbilder (§ 95 UrhG), also Bildfolgen und Bild-Ton-Folgen, bei denen ebenfalls rein technische Erzeugnisse nicht geschützt sind.

Der Hersteller eines Tonträgers (§ 85 UrhG) kann geschützt sein, wenn er auch nicht eigenständig schutzfähige Klänge in einer Abfolge erstmals auf einem Tonträger festhält, also einen Master erstellt. Das Zusammenmixen von KI-produzierten Klängen kann also durchaus geschützt sein. Wenn die KI-Software aber eigenständig die fertige Aufnahme erstellt, ist ein solcher Schutz nicht möglich.

Das Urheberrecht schützt außerdem Datenbanken. Wenn die Datenbank keine persönliche geistige Schöpfung ist, also kein Datenbankwerk (§ 4 UrhG) vorliegt, kommt ein Schutz der Datenbank nach §§ 87a ff. UrhG in Betracht, wenn die Beschaffung, Überprüfung oder Darstellung der Daten in der Datenbank eine wesentliche Investition erfordert. Die Investitionen für die Beschaffung der einzelnen Datenbank-Elemente werden dabei nicht berücksichtigt, weil die Erzeugung der Daten hier gerade nicht geschützt wird. Auch Investitionen für eigens erzeugte Daten werden nicht berücksichtigt. Berücksichtigt werden nur solche Investitionen, die gerade für die Erstellung der konkret betroffenen Datenbank getätigt wurden. Eine durch KI-Software erzeugte Datenbank kann also nur unter engen Voraussetzungen geschützt sein.

Neben diesen Leistungsschutzrechten ist es auch möglich, KI-Technologien zu patentieren, wenn die Voraussetzungen des Patentgesetzes vorliegen. Dies ist auch denkbar für Erfindungen, bei denen KI-Software als Hilfsmittel eingesetzt wurde. Eine Patentierung für Erfindungen, die ohne menschliche Beteiligung unmittelbar auf KI-Software zurückgehen, scheitet nach derzeitiger Rechtslage jedoch aus.

Ausblick

Die Gesetzeslage ist im ständigen Wandel und wird Stück für Stück der gesellschaftlichen und wirtschaftlichen Realität angepasst. Technologien, die künstliche Intelligenz und Machine Learning nutzen, werden immer präsenter und für immer mehr Unternehmen wirtschaftlich sehr wichtig. In Zukunft werden wirtschaftlich noch sehr viel bedeutendere Entwicklungen auf künstliche Intelligenz zurückgeführt werden können.

Wenn die Gesetzgeber nicht reagieren und Mechanismen schaffen, die künstliche Intelligenz und deren Erzeugnisse ausreichend schützen, werden die Verantwortlichen die zukunftsfähige KI-Entwicklung in Staaten mit besserem Schutz verlagern und die Wettbewerbsvorteile dort nutzen. Die Herstellung eines angemessenen Schutzes sollte deshalb nicht warten.