c) All das wäre nicht möglich ohne einen der frechsten Raubzüge der Menschheitsgeschichte. Die KI klaut mit einer Schamlosigkeit, die einem die Schamesröte ins Gesicht treibt. Oder die Wut – farblich macht es keinen Unterschied.
Das gilt für ChatGPT wie für DeepSeek, für Apples AI ebenso wie für Googles Gemini, wie in diesem März eine Studie der Danish Rights Alliance aufdeckte. Eli Collins, Vizepräsident von Google Deepmind, räumte bei einer Anhörung des US-Justizministeriums am 2. Mai 2025 ein, dass Gemini auch dann mit Daten aus Suchergebnissen trainiert werde, wenn Urheber und Verlage es ausdrücklich untersagen.
Am offensichtlichsten wird der Diebstahl beim Mutterkonzern von Facebook, Instagram und WhatsApp: Um seine KI zu trainieren, hat Meta sie zunächst das Internet durchlesen lassen. Schön und gut. Leider wurden die Programme davon nicht intelligent. Dazu braucht es Bücher: Dort gibt es belastbares Wissen und belastbare Sprache. Ohne den Verstand und die Kunstfertigkeit von Menschen keine KI.
Nun hätte Meta eine Lizenz zum Training erwerben können und müssen – das aber war dem Konzern zu aufwendig. Bekannt wurde der Fall, weil im Zuge eines US-Gerichtsverfahrens interne Chatprotokolle öffentlich wurden.
Das Magazin The Atlantic deckte auf, mit welchem abenteuerlichen Trick Meta stattdessen vorging: Unzählige urheberrechtlich geschützte Werke liegen illegal in sogenannten Schattenbibliotheken, eine der weltweit größten ist die russische Plattform LibGen. Sie umfasst mehr als 7,5 Millionen Bücher und über 80 Millionen wissenschaftliche Studien. Ausweislich der Protokolle war es offenbar Mark Zuckerberg selbst, der gegen juristische und ethische Vorbehalte im Unternehmen entschied, auf die Daten zuzugreifen.
In der US-Klageschrift steht, Meta habe "267 Terabyte an raubkopiertem Material" heruntergeladen.
d) Das ist nicht gut.