Současná vlna generativní umělé inteligence, jejíž schopnosti v podobě ChatGPT a dalších ohromují veřejnost, jsou možné jen díky tomu, že vědci mohli „vycvičit“ chování složitých algoritmů na základě již existujících textů nebo obrazů. Ty tak AI do jisté míry jen napodobuje. I když nejde o prosté kopírování a porušování autorských práv, okamžitě se rozhořela debata o tom, kde vlastně leží ona hranice.
Na tuto otázku tak bude muset odpovědět soud. Deník New York Times žaluje společnosti OpenAI a Microsoft za to, že používají zveřejněné zpravodajské články k tréninku svých chatbotů s umělou inteligencí, aniž by s nimi uzavřely dohodu o náhradě za duševní vlastnictví. Žaloba, která byla podána u federálního okresního soudu na Manhattanu, je prvním případem, kdy velká zpravodajská organizace stíhá vývojáře ChatGPT za porušení autorských práv. Zástupce vydavatele neupřesnil, jakou částku požaduje od společností vyplatit, ale uvedl, že „tato žaloba se je snaží přimět k odpovědnosti za zákonné a skutečné škody ve výši miliard dolarů“.
The New York Times sued OpenAI and Microsoft for copyright infringement, a new front in the debate over the use of published work to train AI. https://t.co/u8qZ247dCl
— The New York Times (@nytimes) December 27, 2023
NYT tvrdí, že OpenAI a Microsoft, tvůrci aplikací Chat GPT a Copilot, „se snaží využít obrovských investic The Times do žurnalistiky“, aniž by měli uzavřeny licenční smlouvy. V jedné části stížnosti noviny zdůrazňují, že jejich doména www.nytimes.com byla nejpoužívanějším proprietárním zdrojem, z něhož se těžil obsah pro trénink GPT-3.
K tréninku modelů umělé inteligence bylo údajně použito více než 66 milionů záznamů, od aktuálních zpravodajských článků až po články publikované na webových stránkách a dalších přidružených značek. Žaloba tvrdí, že žalovaní v tomto případě použili obsah chráněný autorskými právy v hodnotě téměř jednoho století, čímž způsobili významnou škodu. NYT rovněž tvrdí, že produkty OpenAI a Microsoft mohou „generovat výstupy, které doslovně recitují obsah Times, přesně jej shrnují a napodobují jeho výrazový styl“.
I ostatní velké zpravodajské domy jako je CNN nebo BBC uvedly, že musely zasahovat proti robotům, kteří se z jejich webů a archivů snažily vytěžit velké množství informací pro trénink umělé inteligence.