- A. Wikipedia
- B. Wikimedia Commons
- C. Wikidata und CC0
- D. Urheberrechtliche Schranken und Gemeinfreiheit bei Wiki-Projekten
- E. Künstliche Intelligenz als Reizthema
1 Wikipedia ist das größte Community-Projekt im Internet mit über 62 Millionen Nutzenden weltweit.
2 Neben dem Projekt Wikipedia existieren im so genannten „Wikiversum“ noch weitere Projekte wie WikiCommons oder Wikidata, die hier ebenfalls vorgestellt werden. Im folgenden Abschnitt wird dargestellt, wie die CC-Lizenzen bei Wikipedia, Wikimedia Commons und Wikidata zum Einsatz kommen, wie die Weiternutzung der so verfügbar gemachten Inhalte abläuft und welche weiteren rechtlichen Aspekte eine Rolle spielen.
A. Wikipedia
3 Wikipedia ist eine freie, mehrsprachige Online-Enzyklopädie, die von Freiwilligen erstellt wird. Das Projekt wurde im Januar 2001 von Jimmy Wales und Larry Sanger ins Leben gerufen. Die Inhalte der Wikipedia basieren auf Beiträgen der das Projekt tragenden Wikipedia-Community. Die Community besteht aus vielen Tausend ehrenamtlich Beitragenden, die sich sowohl nach den von ihnen gesprochenen und bearbeiteten Sprachen als auch nach Themen in zahlreichen Untergruppen organisieren.
4 Bei der Wikimedia Foundation, die als Betreiberin der Server für Wikipedia und die anderen Wiki-Projekte und als Inhaberin der entsprechenden Marken rechtlich betrachtet die notwendige Rolle der verantwortlichen Organisation
5 In der Regel werden Beiträge von mehreren Autorinnen und Autoren verfasst und iterativ immer wieder aktualisiert, was als kollaboratives Schreiben verstanden wird. Es gibt inzwischen rund 60 Millionen Artikel in über 330 Sprachen und Dialekten.
6 „Wikipedia ist eine Enzyklopädie.
Beiträge sind so zu verfassen, dass sie dem Grundsatz des neutralen Standpunkts entsprechen.
Inhalte sind frei, sie müssen unter einer freien Lizenz stehen.
Andere Benutzer sind zu respektieren und die Wikiquette einzuhalten (eine Ableitung von dem Schachtelwort Netiquette, das wiederum auf das englische ‚net‘ und das französische ‚étiquette‘ für Benimmregeln zurückgeht).“
(Hervorhebung nicht im Original)
I. CC BY-SA 4.0 in Wikipedia
7 In den Nutzungsbedingungen der Wikimedia Foundation heißt es, dass Beiträge der Allgemeinheit weitreichende Befugnisse zur Weiterverbreitung und Weiternutzung einräumen müssen. Mit der Erstellung eines Wikipedia-Beitrags wird dieser automatisch unter CC BY-SA 4.0 sowie der GNU Free Documentation License (GFDL, ohne Versionsangabe) lizenziert
8 In den ersten Jahren des Projekts stand der Inhalt der Wikipedia nur unter der GFDL, einer Lizenz der Free Software Foundation, die als Freigabewerkzeug für Softwaredokumentation entwickelt wurde. Es gab es aber die Kritik, dass die GFDL zu kompliziert sei, und ihr offizieller Text steht zudem ausschließlich in englischer Sprache zur Verfügung. Mit der Einführung der CC-Lizenzen entstand in der Wikipedia-Community die Forderung, Wikipedia-Beiträge unter die Lizenz CC BY-SA zu stellen. Dies versprach mehr Benutzerfreundlichkeit und eine bessere Passung mit den Bedürfnissen kollaborativen Schreibens.
9 Rechtstechnisch hätte eine solche nachträgliche Änderung der Lizenz jedoch die individuelle Zustimmung jeder und jedes Einzelnen erfordert, die oder der bereits Inhalte erstellt hatte. Eine solche massenhafte Einzelabfrage der Zustimmung, das war allen klar, war praktisch nicht durchführbar, zumal eine pauschale Umlizenzierung eine Zustimmungsquote von 100 % erfordert hätte.
10 Deshalb ging man einen anderen Weg: Die Wikimedia Foundation gemeinsam mit Creative Commons und der Free Software Foundation verständigten sich darauf, die seinerzeit aktuelle Version 1.2 der GFDL zu einer Version 1.3 weiterzuentwickeln, die eine zusätzliche, auf das Umlizenzierungsproblem der Wikipedia hin maßgeschneiderte Klausel 11 erhielt. Sie erlaubt unter engen Voraussetzungen, dass der Betreiber eines kollaborativen Autorenprojekts eine Umlizenzierungsentscheidung im Namen aller Beitragenden trifft, ohne dass diese einzeln zustimmen müssen.
11 Da die damals bestehenden Wikipedia-Inhalte unter GFDL ohne Versionsangabe standen und damit automatisch stets die neueste GFDL-Version galt (was heute noch immer der Fall ist), unterfielen sie durch die GFDL-Versionierung auf 1.3 ohne weitere Schritte auch deren neuer Klausel 11. So wurde es möglich, im Jahr 2009 den gesamten damaligen Bestand der Wikipedia und weiterer Wikimedia-Projekte durch schlichte Entscheidung der Wikimedia Foundation als Betreiberin zusätzlich unter die CC-Lizenz BY-SA 3.0. zu stellen.
12 Der oben erwähnte Automatismus der Wikimedia-Nutzungsbedingungen zur Lizenzierung der Wikipedia-Beiträge unter CC BY-SA setzt ausdrücklich voraus, dass es sich um Inhalte handelt, die überhaupt (urheber‑)rechtlich geschützt sind. Hierunter fallen solche Inhalte nicht, für die schon von ihrer Art her kein Urheberrechtsschutz in Frage kommt oder deren Schutz inzwischen abgelaufen ist. Die Nutzungsbedingungen greifen damit einen Aspekt auf, der auch in den CC-Lizenzen festgeschrieben
II. Einfügen von Inhalt aus anderen Quellen in Wikipedia
13 Beim Einbau von Inhalten aus anderen Quellen in die Wikipedia müssen die Benutzer darauf achten, dass durch den Einbau keine Rechte Unbeteiligter verletzt werden. Beispielsweise darf ein Artikel aus einem verlagsmäßig publizierten Lexikon nicht ohne Erlaubnis des Verlages in die Wikipedia eingefügt werden, auch wenn er inhaltlich noch so gut passen würde. Dadurch würden nämlich zum einen die Rechte des Verlages und seiner Autoren verletzt. Zum anderen fände (wegen der strengen Schutzfunktion des Urheberrechts) die oben erwähnte automatische Lizenzierung unter CC BY-SA und GFDL keine Anwendung, ohne dass dies jedoch für Nutzende der Wikipedia erkennbar wäre, die wiederum ihrerseits – im Vertrauen auf die vom Projekt versprochene freie Nutzbarkeit aller Wikipedia-Inhalte – die Inhalte möglicherweise anderswo weiterverwenden, ohne dazu tatsächlich berechtigt zu sein. Die Strenge des Urheberrechts führt dazu, dass sich in einer solchen Situation nicht einmal Privatpersonen darauf berufen können, dass sie ihre mangelnde Berechtigung weder kannten noch kennen konnten. Nicht zuletzt wegen solcher Szenarien ist die Wikipedia-Community dafür bekannt, in Urheberrechtsfragen sehr alert und genau zu sein.
14 Sind wiederum die Drittinhalte CC-lizenziert oder stehen sie unter einer anderen freien Lizenz, ist ein Einbau dieser Inhalte etwa in einen Wikipedia-Text möglich, sofern Lizenzkompatibilität zwischen dem anderswo vorgefundenen Inhalt und der in der Wikipedia verwendeten Lizenz CC BY-SA 4.0 besteht. Hierzu wird auch ausdrücklich in den Nutzungsbedingungen der Wikimedia Foundation hingewiesen.
BY-SA (Version 4.0 oder später)
durch Creative Commons ausdrücklich für kompatibel im Sinne der Share-Alike-Klausel in CC BY-SA 4.0 erklärte Lizenzen; das sind derzeit nur
: Free Art License 1.3
GPLv3 (es kann hier allerdings nur Material unter CC BY-SA 4.0 nach Bearbeitung unter GPLv3 weiter lizenziert werden, nicht aber umgekehrt GPLv3-Material später unter CC BY-SA 4.0)
15 Dies gilt sowohl bei der Integration anderer urheberrechtlicher Werke, die unter CC BY-SA 4.0 stehen und in einen Wikipedia-Artikel eingebracht werden, als auch bei der Weiternutzung.
16 Keine Einschränkungen durch die CC-Lizenz oder die Wikipedia-Mitmachregeln gibt es wiederum bei Nutzungen, die das Urheberrechtsgesetz ohnehin erlaubt.
III. Weiternutzung von Wikipedia-Artikeln
17 Sobald also ein Wikipedia-Artikel erstellt ist, steht er automatisch unter CC BY-SA 4.0. Das heißt, dass eine Namensnennung der Autoren und Autorinnen erfolgen muss, wenn der Artikel jenseits des reinen Lesens genutzt wird. In den Nutzungsbedingungen der Wikimedia Foundation heißt es dazu, wie die Namensnennung zu geschehen hat:
I. „Durch einen Hyperlink auf den Artikel (sofern möglich) oder die Angabe der URL des Artikels, zu dem du beigetragen hast (da jeder Artikel über eine Versionsgeschichte verfügt, in der sämtliche Beitragende, Autoren und Bearbeiter aufgeführt sind);
II. Durch Hyperlink (sofern möglich) oder URL auf eine andere, stabile Online-Kopie, die frei zugänglich ist, die relevante Lizenz erfüllt und die Namensnennung der Autoren auf eine Weise gewährleistet, die gleichwertig zu der auf den Projekt-Websites ist; oder
III. Durch eine Liste aller Autoren (bitte beachte allerdings, dass jede Liste von Autoren gefiltert werden kann, um sie um sehr kleine oder irrelevante Beiträge zu bereinigen).“
18 Damit werden nur Optionen für die Wikipedia-Nachnutzung genauer beschrieben, die ohnehin in CC-Lizenzen stehen. Die in der Wikipedia verwendete Lizenzvariante CC BY-SA 4.0 fordert bei der Weiternutzung aber nicht nur die Namensnennung, sondern auch, dass dann, wenn die Weiternutzung die Wikipedia-Texte irgendwie verändert, für die veränderte Fassung wieder die gleiche Lizenz (also wieder CC BY-Sa 4.0) gelten muss. Damit soll erreicht werden, dass das freie Wissen der Online-Enzyklopädie dauerhaft auch frei bleibt und nicht etwa durch jemanden, der eigene Überarbeitungen vornimmt, rechtlich „eingeschlossen“ werden kann.
B. Wikimedia Commons
19 Das Projekt Wikimedia Commons stellt ein frei zugängliches Medienarchiv aus Fotos, Videos oder Tonclips zur Verfügung, das von Ehrenamtlichen (Community) befüllt und gepflegt wird. Wikimedia Commons gibt es seit 2004 und es enthält derzeit bereits 107.466.094 Dateien.
20 Im Unterschied zu Wikipedia hat bei Wikimedia Commons die oder der Beitragende beim Hochladen eines Inhalts (also eines Bilds, Videos oder Tonclips oder einer sonstigen Mediendatei) die Wahl zwischen mehreren im Projekt offiziell unterstützten Lizenzen und kann darüber hinaus auch andere Lizenzen verwenden – solange der hochgeladene Inhalt am Ende zumindest unter einer als frei geltenden Lizenz verfügbar ist, ggf. neben weiteren Lizenzen (was sich dann Mehrfach- oder Parallellizenzierung nennt).
21 Die auf Wikimedia Commons genannten offiziell unterstützten Lizenzen sind:
Die CC-Lizenzvarianten BY und BY-SA
Die GNU-Lizenzen GPL und LGPL
Die Free Art Licence/Licence Art Libre
Die Lizenzen von Open Data Commons (für Daten)
22 Andere freie Lizenzen können, wie gesagt, auch eingesetzt werden, müssen dann aber durch passenden Wikitext “von Hand” eingetragen werden. Einzige Alternative zur Freigabe mittels Lizenz ist die Angabe, dass das Material rechtefrei (gemeinfrei) ist. Dann darf überhaupt keine Lizenz angegeben werden, weil es ja kein lizenzierbares Recht gibt. Um die Anzahl der Fälle zu reduzieren, bei denen Hochladende fälschlicherweise davon ausgehen, dass Inhalte gemeinfrei seien, müssen ein paar wichtige Indizien für diesen rechtlichen Status beim Upload per Checkbox bestätigt werden.
23 Dass gar keine Lizenz (oder Angabe zum gemeinfreien Status) ausgewählt wird, ist nicht vorgesehen, und der entsprechende Schritt daher fester Bestandteil des Upload-Vorgangs. Nach dem Upload wird der jeweilige Inhalt dann mit dem passenden Lizenzhinweis eingeblendet und es erfolgt eine Einordnung der Dateien in die jeweilige Lizenzkategorie.
24 Nicht wählbar sind in Wikimedia Commons:
Lizenzen (auch solche von Creative Commons), die einzig nicht-kommerzielle Nutzungen erlauben und/oder die Bearbeitung des Inhalts nicht zulassen
Eine Nutzbarkeit aufgrund gesetzlicher Lizenzen, die nur für spezifische Kontexte gelten (etwa gemäß dem US-amerikanischen Fair-Use-Grundsatz oder auf Grundlage des Zitatrechts im deutschen Urheberrechtsgesetz)
C. Wikidata und CC0
25 Wikidata ist eine freie, kollaborative Datenbank, die zur Sammlung strukturierter Daten für die Unterstützung von Wikipedia, Wikimedia Commons und anderen Wiki-Projekten geschaffen wurde.
26 Die Besonderheit der Datenbank ist, dass die Daten unter CC0 veröffentlicht werden. CC0 gibt die Datenbank inkl. der gesammelten Daten der Allgemeinheit ohne jegliche Beschränkung frei; auch eine Namensnennung ist bei der Nutzung nicht erforderlich (zu CC0 ausführlich siehe Kommentierungsteil dort).
D. Urheberrechtliche Schranken und Gemeinfreiheit bei Wiki-Projekten
27 Da Wiki-Projekte nur Inhalte enthalten, die entweder gemeinfrei sind oder unter einer Wikipedia kompatiblen Lizenz stehen oder bei denen der Ersteller seinerseits eine CC BY-SA-Lizenz vergeben darf, wäre es unzulässig, sich auf eine nur in bestimmten Kontexten aufgrund urheberrechtlicher Schrankenregelungen geltende Nutzungserlaubnis zu berufen. Das macht die Wikimedia Foundation auch in den Nutzungsbedingungen deutlich.
28 Wenn nur eine Schrankenregelung die Nutzung erlaubt, ansonsten aber „alle Rechte vorbehalten“ gilt, reicht dies für die durch die Wikimedia-Projekte angestrebte freie Nutzung nicht aus, denn jede Schrankenregelung gilt nur für einen bestimmten Nutzungskontext oder einen bestimmten Nutzungszweck. Die Inhalte der Wikimedia-Projekte sollen aber in beliebigen Kontexten und für beliebige Zwecke nutzbar sein. Die Wikimedia-Communities gelten denn auch als besonders gewissenhaft in Sachen Urheberrecht.
29 Ähnlich verhält es sich mit der zeitlichen Begrenzung des Urheberrechts. Es läuft irgendwann ab, nach deutschem Recht (§ 64 UrhG) 70 Jahre nach dem Tod des Urhebers. Ist diese Zeit verstrichen und besteht somit kein Urheberrecht mehr, gibt es auch nichts mehr zu lizenzieren. Solche Werke sind gemeinfrei und dürfen völlig frei genutzt werden. Sie unter CC-Lizenz stellen zu wollen, wäre nicht nur formaljuristisch wirkungslos, sondern kann als sog. Schutzrechtsberühmung sogar juristische Konsequenzen haben (siehe auch Abschnitt 8 Rn. 7). Entsprechend dürfen gemeinfreie Werke zwar in die Wikimedia-Projekte eingebracht werden, aber es darf dann keine Lizenz dafür „vergeben“, sondern es muss während des Uploads die Kennzeichnung als gemeinfrei gewählt werden.
E. Künstliche Intelligenz als Reizthema
30 Viele innovative Digitaltechnologien entfalten ihren Mehrwert nur in Bezug auf große Mengen digitaler Inhalte, etwa Semantic Web und Geodatendienste. Die weitaus einflussreichste Innovation der letzten Jahre sind jedoch generative KI, also IT-Systeme wie ChatGPT und Midjourney, die mittels stochastischer Verfahren Inhalte erzeugen können, die mit vertretbarem Aufwand nicht mehr von menschlich erstellten Texten, Bildern, Videos, Musikstücken usw. zu unterscheiden sind. Die Umwälzungen, die diese „KI-Revolution“ seit Ende 2022 sowohl in der Welt professioneller Kreativer als auch für kreative Amateure und auch gesamtgesellschaftlich bewirkt, sind nicht zu übersehen. Und natürlich sind auch die Wikimedia-Projekte davon betroffen, in zwei Richtungen: als Materialsammlungen für KI-Technologien und durch KI-generierte Inhalte, die umgekehrt wieder in sie hineinfließen.
I. Wikimedia-Projekte als Materialsammlungen fürs KI-Training
31 Die Inhalte von Wikipedia, Wikimedia Commons, Wikidata und den weiteren kleineren Wikimedia-Projekten sind menschlich kuratiertes, standardisiert aufbereitetes und mit viel Aufwand qualitätsgesichertes digitales Material, das ohne technische Hürden abrufbar ist und dank freier Lizenzen umfassend genutzt werden darf. Es verwundert daher nicht, dass der Gesamtbestand an Text einer jeden Wikipedia-Sprachversion Teil von so gut wie jedem Datensatz ist, mit dem Sprach-KIs auf diese Sprache trainiert werden. Dasselbe gilt für Wikimedia Commons und Bild-KIs und Wikidata ist als eine Art „maschinenlesbares Wissen“ sogar ausdrücklich dafür geschaffen worden, technischen Systemen das „Verstehen“ von Bedeutungszusammenhängen zu erleichtern.
32 Schon seit es die bekannten Assistentenprodukte wie Amazons Alexa, Apples Siri und andere gibt, ist klar, dass diese Mission von Wikidata erfolgreich war. Zwar beziehen diese Assistenten ihr „Wissen“ aus einer Mischung diverser Quellen und können dank KI immer besser auch unkuratierte, eher chaotische Quellen auswerten. Als diese Technologie jedoch in den Kinderschuhen steckte, war es maßgeblich den speziell aufbereiteten vernetzten Datensammlungen wie Wikidata zu verdanken, dass daraus funktionierende Produkte entstehen konnten.
33 Das hat seit jeher Debatten ausgelöst innerhalb von Projekten wie Wikipedia. Denn das Open-Paradigma (vgl. Einl Rn. 6), das ja gerade technische Innovationen ermöglichen will wie die genannten, gerät fast automatisch immer mit in die Kritik, wenn sich die Schattenseiten dieser Innovationen zeigen. Schon vor Jahrzehnten wurde deshalb darüber gestritten, dass Open-Source-Software auch für Waffensysteme verwendet werden kann und verwendet wird. Ähnliches spielt sich jetzt rund um KI ab.
34 Es geht dabei zum einen um die unmittelbaren Wirkungen der innovativen Technologien, also aktuell etwa die Auswirkungen der allgemeinen Verfügbarkeit generativer KI für Berufstätige im Bereich der sog. Gebrauchskunst u.ä. (Grafikerinnen, Texter, Komponisten von Hintergrundmusik usw.). Zum anderen wird von einigen kritisch gesehen, dass mit neuen Technologien typischerweise sehr viel Geld verdient wird, und das zu einem gewissen Teil dank der ehrenamtlichen Arbeit der Wikimedia-Communities, ohne dass es einen direkten Rückfluss gäbe, etwa an Spendengeldern.
35 Nun ist es aber gerade die Open-Content-Idee, dass es nicht die üblichen Austauschverhältnisse Inhalt gegen Geld geben soll. Allerdings soll es, zumindest im CC-Ansatz und diversen weiteren Standardlizenzsystemen durchaus eine „Gegenleistung“ geben, nämlich die Namensnennung als öffentlich sichtbare Würdigung. Und gerade an der hapert es ebenfalls bei den innovativen Technologien oft. Die erste große Debatte dazu gab es rund um Kartendaten des Projekts Open Streetmap (OSM), die von Kartendienstbetreibern eingelesen und genutzt wurden, ohne dass die Leistungen des OSM-Projekts und seiner Mitwirkenden sichtbar wurden. Erst die Hartnäckigkeit der OSM-Community führte dazu, dass heute entsprechende Hinweise in Kartendiensten eingeblendet sind.
36 Die Wikimedia-Communities haben ähnliche Schwierigkeiten. Einzig Wikidata ist mit seiner bedingungslosen Freigabe unter CC0 schon von vornherein nicht auf Namensnennung oder „Copyleft“ ausgelegt. Wikipedia und Wikimedia Commons sind es sehr wohl, bislang wurde jedoch noch kein für alle zufriedenstellender Weg gefunden, die Namensnennung sinnvoll in nachnutzenden Systemen umzusetzen, weder bei den Assistenzprodukten noch bei den neueren generativen KI-Systemen. Auch Copyleft, also die Freigabe auch abgeleiteter Inhalte unter derselben Lizenz, ist bei solchen Systemen ein Problem, denn es ist noch nicht einmal rechtlich klar, ob bzw. wann sie schutzfähige Inhalte hervorbringen, für die Copyleft gelten könnte. Hier sind also noch interessante Entwicklungen und Diskussionen zu erwarten.
II. KI-Inhalte als Material für Wikimedia-Projekte
37 Auch umgekehrt ist vieles noch offen, also bei der Frage, ob und wenn ja wie KI-generierte Inhalte eine Rolle spielen dürfen als Material, das in die Wikimedia-Projekte eingeht. Im Hintergrund bei der Pflege der Wikipedia wird KI schon seit Jahren sehr erfolgreich eingesetzt beim Aufspüren von Vandalismus, also von kleinen Bearbeitungen des Wikipedia-Textes, die zum Spaß oder mit destruktiver Absicht gemacht werden. Aber was ist mit der zwei Jahrzehnte lang einzig händischen Erstellung der Texte – soll auch dafür KI eingesetzt werden dürfen? Wenn ja, in welchem Umfang? Und wie soll wer genau das kontrollieren (können)?
38 Ähnlich sieht es bei Wikimedia Commons aus. Dort wurde immer strikt mit Bildmaterial gearbeitet, dass die physische Wirklichkeit abbildet, denn genau das entspricht der enzyklopädischen Funktion der Wikipedia, für die das Medienarchiv ja geschaffen wurde. Inzwischen ist es aber sehr leicht möglich, fotorealistische Bilder schlicht generieren zu lassen. Sollen solche Bilder zugelassen werden, etwa um einen historischen Baustil idealtypisch darzustellen, für den es kein idealtypisches Foto gibt? Und überhaupt, sollen die verschiedenen rechtlichen Hindernisse, mit denen sich die Wikimedia-Commons-Community durchgehend befassen muss (Urheberrecht, Persönlichkeitsrechte Abgebildeter, Markenrecht usw.) mittels KI-generiertem Material umgangen werden?
39 Die Communities der Wikimedia-Projekte, der OSM und anderer Projekte widmen sich diesen Fragen schon sehr eingehend und meist auch öffentlich sichtbar im Netz.
Creative Commons Lizenz
Open Access Kommentar, Kommentierung zu F. Wikipedia und Wikimedia ist lizenziert unter einer Creative Commons Namensnennung 4.0 International Lizenz.