To je ale překvapení. Apple ve své studii rozporuje, že AI „umí myslet“

Glosa
To je ale překvapení. Apple ve své studii rozporuje, že AI „umí myslet“
Fotografie: Apple

Apple vydal studii s názvem „Iluze myšlení“, ve které kritizuje modely AI, které předstírají logické uvažování. I když zní důkazy přesvědčivě, nesnaží se tak jen odvést pozornost od toho, že jemu v této oblasti tak trochu ujíždí vlak?

Ještě před zahájením pravidelné akce WWDC, kde Apple prezentuje zásadní novinky z oblasti softwaru pro svá zařízení, to zase vypadalo, že se bude jednat jen o soutěž, kolikrát za ony dvě hodiny živého přenosu stihne říct „umělá inteligence nebo „Apple Intelligence“, aby tak uklidnil všechny investory, které by snad mohlo napadnout, že Apple se jednoho dnes stane dinosaurem, kterému ujede vlak – jak se to v minulosti stalo IBM, Nokii a řadě dalších firem neméně zvučných jmen.

Jenomže pak přišlo překvapení. Jako by se poslední dva roky nic zajímavého nestalo – Apple změnil číslování svých systémů a všechny je „zalil tekutým sklem“. Tento designový prvek budí kontroverzní reakce a to nejen proto, že hodně připomíná dvacet let staré Windows Vista. Zajímavější však, co při představování systémů nezaznělo. Apple jako by se vyhýbal dříve tolik skloňovanému spojení „Apple Intelligence“. Ukázal jen pár drobností, kterými jen z povinnosti dotahuje konkurenci, jako je živý překlad, nebo Visual Intelligence, která kopíruje „Circle to Search“ z Androidů.

Skoro to vypadá, že se potvrzují předchozí zvěsti, že vývoj vlastního řešení drhne. Nemůže za to ani tak nedostatek zdrojů, ale samotná podstata problémů. Apple se stále drží odkazu svého zakladatele Steva Jobse, který usiloval o dokonalost ve všech ohledech. Naproti tomu „stochastický papoušek“ jak se někdy posměšně přezdívá ChatGPT a jeho klonům, má k něčemu takovému daleko, i když dílčí úspěchy mohou být působivé.

Jak z toho ven? Apple (apple.com) zveřejnil vědeckou studii, kterou opatřil žurnalistickým titulkem „Iluze myšlení“. Zde na velké ploše poměrně podrobně rozebírá, že modely simulovaného uvažování (SR), jako jsou například modely o1 a o3 společnosti OpenAI, DeepSeek-R1 a Claude 3.7 Sonnet Thinking, poskytují při řešení nových problémů vyžadujících systematické uvažování výstupy odpovídající porovnávání vzorů z tréninkových dat. Jinými slovy, je to podobný závěr, ke kterému došel každý, kdo s AI pracuje. Pokud se ptáte na problém, který už někdo někdy vyřešil a publikoval, pak dostanete odpovídající řešení. V opačném případě to může být vše, od obecných vytáček, až po přesvědčivě znějící nesmysly.

Výzkumníci zkoumali takzvané velké modely uvažování (LRM), které se snaží simulovat proces logického uvažování tím, že vytvářejí záměrný textový výstup, někdy nazývaný uvažování v řetězci myšlenek, který údajně pomáhá při řešení problémů krok za krokem. Za tímto účelem postavili modely umělé inteligence proti čtyřem klasickým hádankám - Hanojské věži (přesouvání disků mezi kolíky), skákání v dámě (vyřazování figurek), přechodu přes řeku (přeprava předmětů s omezením) a světu bloků (skládání bloků na sebe), a to od triviálně snadných (jako Hanoj s jedním diskem) až po extrémně složité (Hanoj s 20 disky vyžadující více než milion tahů).

Nakonec vědci zjistili výsledky, které ukázaly, že tytéž modely dosáhly většinou méně než 5 % u nových matematických důkazů, přičemž pouze jeden model dosáhl 25 % a mezi téměř 200 pokusy nebyl ani jeden dokonalý důkaz. Oba výzkumné týmy zdokumentovaly výrazné zhoršení výkonu u problémů vyžadujících rozsáhlejší systematické uvažování.

To však neznamená, že tyto modely umělé inteligence jsou k ničemu. I složité stroje na porovnávání vzorů mohou být užitečné při plnění úkolů, které lidem, kteří je používají, šetří práci, pokud si uvědomují jejich nevýhody a konfabulace. Pro plnění úkolů jako je stereotypní práce nebo brainstorming to může být vysoce užitečné, ale ani když je model označen jako „myslící“ není o moc blíže skutečnému myšlení, pouze vytváří takovou iluzi.

Diskuze ke článku
V diskuzi zatím nejsou žádné příspěvky. Přidejte svůj názor jako první.
Přidat názor

Nejživější diskuze