In Medien wurde in letzter Zeit öfter über den massenhaften Aufkauf antiquarischer Bücher durch US-Firmen berichtet. Das Motiv? Die bislang frei zugänglichen Texte im Netz sind für das Training moderner Sprachmodelle weitgehend ausgeschöpft, berichtet etwa SRF. Deshalb werde inzwischen von KI-Unternehmen "gezielt nach alten Fachbüchern aus Regionalgeschichte, Sprach-, Rechts- und Wirtschaftswissenschaften" gesucht – "Texte mit historischen Sprachstufen und stilistischen Feinheiten, die im heutigen Internet noch fehlen."
Das juristische Schlupfloch dabei sie ein umstrittenes Konstrukt aus dem US-amerikanischen Urheberrecht. Wer digitale Texte im Netz kopiert, riskiert Schadensersatzklagen. Kaufen KI-Unternehmen die Bücher hingegen physisch und vernichten sie nach dem Einlesen, so SRF, gelte dies in der Branche als Versuch, sich auf das sogenannte Fair-Use-Prinzip zu berufen. Es erlaube die Nutzung von urheberrechtlich geschütztem Material ohne ausdrückliche Erlaubnis des Rechteinhabers – sofern sie der öffentlichen Bildung und der Anregung geistiger Produktionen dienen.
Als Lesetipp dazu führt SRF einen Artikel der "Washington Post" ("Inside an AI start-up’s plan to scan and dispose of millions of books") an.