OpenAI přiznává, že nelze trénovat AI bez materiálů chráněných copyrightem

10. 01. 2024

OpenAI přiznává, že nelze trénovat AI bez materiálů chráněných copyrightem

Fotografie: Markus Winkler, unsplash.com

OpenAI zaslala vyjádření britské parlamentní komisi
V něm otevřeně přiznává, že trénovat AI na sto let starých datech by nemělo valný smysl
Současné soudní spory se bude snažit vyřešit smírem
Má však i protiargumenty, pokud dojde k samotnému řízení

Na sklonku loňského roku byla podána žaloba, na jejíž výsledek teď netrpělivě čeká celý technologický svět. Vydavatel deníku The New York Times si v ní stěžuje na OpenAI, že při trénování ChatGPT neoprávněně použili články a další texty z archivu těchto novin. Současné fungování generativní AI totiž přímo závisí na tom, že existuje dostatek zdrojových dat (ať už textů nebo obrázků), ze kterých pak může systém těžit při generování nových.

Deník theguardian.com informuje o stanovisku OpenAI pro Výbor Sněmovny lordů pro komunikace a digitální technologie. „Bylo by nemožné trénovat dnešní špičkové modely umělé inteligence bez použití materiálů chráněných autorskými právy,“ napsala společnost ve svém stanovisku předloženém výboru pro vyšetřování LLM.

Přečtěte si také

To je ale překvapení. Minimálně jedno video z prezentace Google Gemini bylo podvrh

Společnost vysvětlila, že je to proto, že autorská práva dnes pokrývají prakticky všechny druhy lidských projevů: včetně příspěvků na blogu, fotografií, příspěvků na fóru, útržků softwarového kódu a vládních dokumentů. Dodala, že využití tréninkových dat z veřejně dostupných knih a kreseb vytvořených před více než sto lety by mohlo přinést zajímavý experiment, ale neposkytlo by systémy umělé inteligence, které by splňovaly potřeby dnešních občanů.

Společnost OpenAI rovněž trvala na tom, že při trénování svých modelů dodržuje zákony o autorských právech. V novém příspěvku na svém blogu, který zveřejnila v reakci na žalobu The New York Times, uvedla, že používání veřejně dostupných internetových materiálů k trénování AI spadá pod doktrínu tzv. spravedlivého použití.

Přečtěte si také

Dostat citlivé informace z ChatGPT je překvapivě snadné, ukázal experiment

Dokument dále naznačuje, že se OpenAI bude nejspíš snažit najít smír v současné i dalších žalobách. Dává tvůrcům webů možnost, jak zablokovat přístup robota na jejich stránky a hledá oboustranně výhodné možnosti dohody se subjekty, které se cítí její prací dotčeny. V případě The New York Times již jednala o „partnerství s vysokou hodnotou“.

Z dalšího textu je ale také vidět, že je OpenAI připravena i na případný soudní spor a předvádí protiargumenty, které u něj nejspíše použije na sovou obhajobu. Obvinila noviny ze záměrné manipulace s podněty, například ze zahrnutí dlouhých výňatků článků do interakce s chatbotem, aby ho přiměla k opakování obsahu. Obviňuje také deník z toho, že vybírá příklady z mnoha pokusů. OpenAI uvedla, že žaloba podaná deníkem The Times není opodstatněná, ale stále doufá v „konstruktivní spolupráci“.

umělá inteligenceFacebook Twitter

Související články