Anthropicu utekla zvlčilá umělá inteligence. Alespoň v novinových titulcích

Glosa
Anthropicu utekla zvlčilá umělá inteligence. Alespoň v novinových titulcích
Fotografie: Google Gemini Nano Banana 2 (vytvořeno pomocí umělé inteligence)

Antropic má AI model Mythos, který je tak dobrý v lámání zranitelností počítačových systémů, že jej nemůže skoro nikomu ukázat. Ale i tak se k němu dostal někdo nepovolaný. Máme se připravit na digitální apokalypsu?

Jestli máte rádi filmovou sérii Mission Impossible s Tomem Cruisem coby agentem Ethanem Hawkem, pak máte ještě v paměti závěrečné dva filmy, v nichž tento agent pronásleduje zbraň v podobě umělé inteligence, takzvanou Entitu, která se rozhodla ovládnout svět a nebrat přitom žádné zajatce. A znáte to, protože život napodobuje umění, je jen otázkou času, kdy se něco takového stane ve skutečnosti. Ne, že by šlo o nějak vizionářský snímek, předchozí díl šel do kin už v době, kdy ChatGPT měl na svém kontě první sebevraždy.

Zatímco ChatGPT mohl využít toto prvenství a další velké firmy jako Google nebo Microsoft své zázemí, menší firmy se musejí o to víc snažit, mezi nimi i Anthropic, který dlouho sázel na profesionální uživatele, jako vědce nebo programátory, namísto generování veselých obrázků a nesmyslných textů. Ale to asi nestačilo a tak se marketing rozhodl přitvrdit. Začátkem dubna proběhla médii zpráva o „umělé inteligenci nebezpečné tak, že ji není možné nikomu svěřit“.

Podle Antropicu je model Claude Mythos schopen odhalovat s neuvěřitelnou účinností bezpečnostní chyby v softwaru s takovou účinností, že před ním nebyly v bezpečí ani takové instituce jako jsou banky nebo nemocnice. Proto není model nikde dostupný, ale je klíčovým prvkem projektu Glasswing, který sdružuje asi čtyři desítky společností, přes velké hráče v oblasti síťové infrastruktury, přes banky, až pro další velké hráče, jako je Amazon, NVIDIA, Google a Microsoft. Cílem projektu je posunout kyberbezpečnost do nového věku, v němž hraje AI hlavní roli.

Mýtický Mythos

Na rozdíl od běžných modelů dokáže Mythos řešit komplexní úkoly o desítkách kroků úplně sám – například najít chybu, napsat pro ni exploit (útočný kód) a získat administrátorská práva v systému. Podle Anthropicu dokázal autonomně najít tisíce „zero-day“ zranitelností (chyb, o kterých nikdo nevěděl) v každém moderním operačním systému (Windows, macOS, Linux) a prohlížeči. Zní to jako švýcarský nožík pro hackery, po jehož uvolnění by digitální svět postihla naprostá apokalypsa.

O to znepokojivěji zní zprávy z médií, které se odkazují na informace agentury Bloomberg (bloomberg.com), že k Mythosu „měl přístup neautorizovaný uživatel“, což má dokládat série screenshotů. Jako by tak oživlo jedno z největších klišé technologických sci-fi o zlovolné entitě, která uteče z laboratoře na internet, kde se může donekonečna skrývat a škodit.

O týden později se ale nic špatného neděje. Z bank po celém světě nemizí miliardy (nebo to dobře tají) a chytrá sídla miliardářů nejsou odstřižená od původních majitelů, aby v nich hackerská omladina pořádala opulentní večírky (nebo si toho zatím nevšimli). O to více pak vzrůstají pochybnosti o celém projektu.

Něco vám ukážeme, ale nesmíte o tom mluvit

Pro uvedení následujících úvah dobře poslouží trochu osobní odbočka. Novináře firmy často někam zvou, něco jim ukazují a chtějí, aby o tom napsali. Někdy zkoušejí i nenápadně tlačit, jako když se ozvou s tím, jestli máme dost materiálů. V poslední době ale pozoruji opačný trend, kdy je mnoho akcí tzv. „pod NDA“. Před návštěvou nebo internetovým přenosem se musí podepsat smlouva, že o tom, co uvidíme nikomu neřekneme, ani vlastní manželce ne (ne, že by ji to zajímalo). Člověk pak v podstatě promarní hodinu svého času tím, že například sleduje dva inženýry, jak si nadšeně hrají s prototypem vysavače. (Teď doufám, že jsem něco neprozradil, jinak tu pokutu nesplatí ani moje vnoučata).

Někdy si říkám, jestli to není jen obrácená psychologie a sázka marketérů na to, že se mezi novináři najde nějaký rebel, který informace vynese ven. Tato příchuť zakázaného ovoce pak může strhnout větší lavinu zájmu než desítky tiskových zpráv a jiných standardních PR prostředků. A sílí hlasy, že o něco podobného se možná snaží i Anthropic. Tvrdí to jak různí experti na sociálních sítích, kteří například zpochybňují až pětinásobnou energetickou náročnost Mythosu, tak ucelené analýzy (aisle.com), podle nichž jsou schopnosti umělé inteligence v oblasti kyberbezpečnosti jsou velmi nerovnoměrné: neporostou plynule s velikostí modelu a skutečnou ochranou je systém, do kterého jsou zabudovány hluboké bezpečnostní znalosti, nikoli samotný model.

Prozatím to tedy vypadá, že konec digitálního světa se nekoná s Ethan Hawke může zůstat v důchodu. Pro nás ostatní je to ponaučení, že se nedá moc věřit jak umělé inteligenci, tak jejím autorům.

Diskuze ke článku
V diskuzi zatím nejsou žádné příspěvky. Přidejte svůj názor jako první.
Přidat názor

Nejživější diskuze