OpenAI přiznává, že nelze trénovat AI bez materiálů chráněných copyrightem

OpenAI přiznává, že nelze trénovat AI bez materiálů chráněných copyrightem
Fotografie: Markus Winkler, unsplash.com
  • OpenAI zaslala vyjádření britské parlamentní komisi
  • V něm otevřeně přiznává, že trénovat AI na sto let starých datech by nemělo valný smysl
  • Současné soudní spory se bude snažit vyřešit smírem
  • Má však i protiargumenty, pokud dojde k samotnému řízení

Na sklonku loňského roku byla podána žaloba, na jejíž výsledek teď netrpělivě čeká celý technologický svět. Vydavatel deníku The New York Times si v ní stěžuje na OpenAI, že při trénování ChatGPT neoprávněně použili články a další texty z archivu těchto novin. Současné fungování generativní AI totiž přímo závisí na tom, že existuje dostatek zdrojových dat (ať už textů nebo obrázků), ze kterých pak může systém těžit při generování nových.

Deník theguardian.com informuje o stanovisku OpenAI pro Výbor Sněmovny lordů pro komunikace a digitální technologie. „Bylo by nemožné trénovat dnešní špičkové modely umělé inteligence bez použití materiálů chráněných autorskými právy,“ napsala společnost ve svém stanovisku předloženém výboru pro vyšetřování LLM.

Společnost vysvětlila, že je to proto, že autorská práva dnes pokrývají prakticky všechny druhy lidských projevů: včetně příspěvků na blogu, fotografií, příspěvků na fóru, útržků softwarového kódu a vládních dokumentů. Dodala, že využití tréninkových dat z veřejně dostupných knih a kreseb vytvořených před více než sto lety by mohlo přinést zajímavý experiment, ale neposkytlo by systémy umělé inteligence, které by splňovaly potřeby dnešních občanů.

Společnost OpenAI rovněž trvala na tom, že při trénování svých modelů dodržuje zákony o autorských právech. V novém příspěvku na svém blogu, který zveřejnila v reakci na žalobu The New York Times, uvedla, že používání veřejně dostupných internetových materiálů k trénování AI spadá pod doktrínu tzv. spravedlivého použití.

Dokument dále naznačuje, že se OpenAI bude nejspíš snažit najít smír v současné i dalších žalobách. Dává tvůrcům webů možnost, jak zablokovat přístup robota na jejich stránky a hledá oboustranně výhodné možnosti dohody se subjekty, které se cítí její prací dotčeny. V případě The New York Times již jednala o „partnerství s vysokou hodnotou“.

Z dalšího textu je ale také vidět, že je OpenAI připravena i na případný soudní spor a předvádí protiargumenty, které u něj nejspíše použije na sovou obhajobu. Obvinila noviny ze záměrné manipulace s podněty, například ze zahrnutí dlouhých výňatků článků do interakce s chatbotem, aby ho přiměla k opakování obsahu. Obviňuje také deník z toho, že vybírá příklady z mnoha pokusů. OpenAI uvedla, že žaloba podaná deníkem The Times není opodstatněná, ale stále doufá v „konstruktivní spolupráci“.

Diskuze ke článku
V diskuzi zatím nejsou žádné příspěvky. Přidejte svůj názor jako první.
Přidat názor

Nejživější diskuze