The New York Times žalují OpenAI a Microsoft za vykrádání placeného obsahu

List The New York Times žaluje OpenAI a Microsoft • Zdroj: Profimedia.cz

28. prosince 2023 · 19:30

Třetím největším zdrojem pro trénování nástroje ChatGPT společnosti OpenAI je americký list The New York Times. Obě strany spolu už měsíce vyjednávají o tom, za jakých podmínek může populární technologie využívající umělou inteligenci s články jednoho z nejúspěšnějších médií na světě pracovat, k dohodě ale zatím nedošlo. Deník se proto rozhodl OpenAI zažalovat, k soudu ale žene i Microsoft, který využívá ChatGPT ve své službě Copilot.

Americký list požaduje náhradu škody za „profitování z masivního porušování autorských práv, komerčního využívání a zneužívání duševního vlastnictví The New York Times“. Podle právníků těchto novin ChatGPT stejně jako chatbot Microsoftu Copilot (dříve Bing Chat) umožňují uživatelům obcházet zábrany placeného obsahu a citují přímo ze zamčených článků. Zástupci The New York Times navíc tvrdí, že už samým využíváním článků deníku porušuje OpenAI autorské právo, jelikož k tomu nedali souhlas.

Chatboty se jen neučí. Kradou

Před spuštěním verze ChatGPT 3.5 před několika měsíci společnost vedená Samem Altmanem zveřejnila zdroje, ze kterých jazykový model vychází. Dataset nazvaný „Common Crawl“ podle žaloby obsahuje 16 milionů unikátních záznamů, které vyšly na webu The New York Times. Více dat pro trénink ChatGPT pochází už jen z Wikipedie a databáze amerických patentů. Mezi další zdroje patří například LA Times, britský The Guardian nebo server pro rezervaci ubytování Booking.com. Nyní už OpenAI tolik detailů o datech, na nichž umělou inteligenci trénuje, nezveřejňuje.

List staví svou žalobu na tom, že novinařina je drahá a že každý článek vychází z práce reportérů, jimž musí zaplatit, což je také jeden z důvodů, proč The New York Times nabízejí placený obsah. „Tím, že žalovaní poskytují obsah deníku bez jeho svolení nebo povolení, podkopávají a poškozují vztah deníku s jeho čtenáři a připravují jej o příjmy z předplatného, licencí, reklamy a z partnerských smluv,“ argumentují právníci listu.

V žalobě také popisují způsob, jakým se mohou uživatelé nástrojů ChatGPT a Copilot od Microsoftu dostat k článkům, které jsou pro ostatní uživatele internetu nepřístupné, pokud za ně nezaplatí. Podle nich stačí chatboty požádat, aby citovaly první odstavce z konkrétního textu, a stroje tak učiní. Tvrzení ověřil server Ars Technica a zjistil, že v případě ChatuGPT to již možné není, u Copilotu ale stále funguje. The New York Times a potenciálně i další placená média tak přicházejí o zdroje příjmů.

Kdo je OpenAI a co má společného s Microsoftem

Původně neziskovou společnost, která měla zajistit bezpečný vývoj umělé inteligence, založili v roce 2015 podnikatelé Elon Musk a Sam Altman, který ji dosud řídí. Proslavila se zejména poté, co na konci roku 2022 zpřístupnila veřejnosti nástroj ChatGPT, který je schopný vést konverzaci téměř na lidské úrovni a vytvářet podle zadání například tabulky a další obsah. OpenAI také vyvinula generátor DALL-E, který dokáže vytvářet obrázky na základě textového příkazu. V současné době je hlavním partnerem OpenAI společnost Microsoft, která se zavázala do vývojáře AI nástrojů investovat 13 miliard dolarů.

Právníci amerického listu odmítají, že by se jednalo o využití dat k „transformativním účelům“, jak dosud OpenAI svůj přístup k datům chráněným autorskými právy ospravedlňuje. Podle nich jde o „krádež publika“.

Další bod obžaloby se týká „halucinování“ modelů umělé inteligence. Tedy případů, kdy chatbot předkládá informace, u nichž předpokládá, že je uživatel chce slyšet. V takových momentech ale často dochází k tomu, že chatbot nabízí smyšlené články nebo informace z těch existujících upravuje. Žaloba jako příklad uvádí tvrzení chatbota, že v minulosti vyšel na webu The New York Times článek s titulkem Studie zjistila možnou souvislost mezi pomerančovým džusem a nehodgkinským lymfomem. Žádný takový text ovšem americký list nikdy nevydal, a jeho právníci se proto obávají, že ChatGPT může mít negativní vliv i na reputaci média.

Vymazat a zaplatit. Anebo?

Vedení OpenAI jakékoli pochybení nebo porušování zákonů odmítá. „Respektujeme práva tvůrců a vlastníků obsahu a jsme odhodláni s nimi spolupracovat, abychom zajistili, že budou mít z technologie AI a nových modelů příjmů prospěch,“ uvádí společnost. Příkladem tohoto přístupu je dohoda se společností Axel Springer, která vydává tituly jako Politico, Business Insider nebo německá média Welt a Bild. Na základě této dohody může ChatGPT používat produkci německého vydavatelství k trénování velkých jazykových modelů včetně placeného obsahu. Na spolupráci s OpenAI se letos dohodla také zpravodajská agentura AP.

Jednání o využívání obsahu The New York Times však končí žalobou. „Naše probíhající rozhovory byly produktivní a postupovaly konstruktivně vpřed, takže jsme tímto vývojem překvapeni a zklamáni. Doufáme, že najdeme oboustranně výhodný způsob spolupráce, jaký máme s mnoha dalšími vydavateli,“ uvádí ve svém prohlášení OpenAI. Společnost Microsoft případ zatím nekomentovala.

Žaloba se domáhá vymazání všech citací, ve kterých ChatGPT čerpá z The New York Times, a odstranění veškerých dat z tohoto zdroje, která sloužila pro výcvik jazykového modelu. Výši finanční náhrady škody americký list zatím nespecifikoval.

Ostrá žaloba a tvrdé požadavky však podle novináře Coryho Weinberga ze serveru The Information mohou být i nástrojem vyjednávací taktiky k dosažení výhodnějších licenčních podmínek. „The Times jdou po OpenAI a Microsoftu v době, kdy je dobrá pověst těchto společností ohrožená více než kdy jindy,“ odůvodňuje svůj názor. „Prozatím očekávejme, že se nejnovější bitva mezi technologiemi a zpravodajstvím bude odehrávat na půdě veřejného mínění, zatímco v zákulisí se budou manažeři dohadovat o podmínkách dohody.“