Značka Boston Dynamics je ve světě robotů pojem. I když nemusí být nutně nejlepší, její marketing je rozhodně působivý, když jeho roboti předvádějí neuvěřitelné kousky, nebo se jen tak baví. Stejnou pozornost na sebe strhla umělá inteligence v podobě ChatGPT a jeho derivátů. Bylo tedy jen otázkou času, než se někdo rozhodne propojit tyto dvě věci dohromady.
Na výsledek se můžete podívat na videu výše. Robot Spot v něm dostane slušivý klobouček a zhostí se role průvodce po firmě. Nejen že vysvětluje návštěvníkům, co kde je, ale také je schopen odpovídat na jejich dotazy. Na začátků se návštěvníků zeptá na jména, ty si pamatuje a nenuceně je pak používá při konverzaci. Zajímavá je rovněž úroveň hlasové syntézy. Zatímco v minulosti bývaly robotické hlasy většinou snadno rozpoznatelné a únavné při delším poslechu únavné, první verze s britským přízvukem a hereckým přednesem působí opravdu charismaticky. „Děkuji, moje jazykové schopnosti byly pečlivě vyladěny, aby poskytly autentický britský zážitek,“ odpovídá s typicky suchým britským humorem robot na kompliment ohledně jeho přízvuku.
„Inspirovali jsme se zjevnou schopností LLM (velkých jazykových modelů) hrát role, replikovat kulturu a nuance, vytvářet plány a udržovat koherenci v čase, stejně jako nedávno vydanými modely Visual Question Answering (VQA), které dokážou popisovat obrázky a odpovídat na jednoduché otázky k nim,“ popisuje svou práci Matt Klingensmith.
Nejvíce však výzkumníky bavila práce na několika rozlišných osobnostech, které mohou fungovat v roli průvodce. Vedle archeologa z počátku minulého století se tak robot může chovat i jako člověk, který časem přicestoval z časů Shakespeara a mluví podobně jako on. Ale asi nejpůsobivější je okamžik, kdy robot hraje roli „puberťáka“ a jeho typického slangu. Ve videu najdete tento okamžik zhruba od 6. minuty dále.