Google se všemožně snaží, aby v závodě umělých inteligencí nezůstal příliš pozadu. Zhruba půl roku po ChatGPT přišel s Bardem - generativní AI založené na velkých jazykových modelech, kterou postupně učí nové jazyky, včetně češtiny a integruje ji do svých nástrojů. Jenže ChatGPT mezitím povýšil na verzi 4, jejíž schopnosti značně přesahují vše, co bylo dosud viděno.
Odpověď Googlu se měla jmenovat Gemini a měla být odhalena na velkolepých akcích New Yorku, Washingtonu, a Kalifornii. I zde měl být hlavní devizou přechod od čistě textového generátoru k multimediální instanci, která chápe souvislosti napříč různými vstupy. „Viděla jsem úžasné věci,“ řekla o Gemini Sissie Hsiaová, viceprezidentka společnosti Google a manažerka oddělení Bard a Google Assistant, v rozhovoru pro Business Insider. „Třeba když se snažím upéct dort, nakreslím tři obrázky, jak se dělá třívrstvý dort, a Gemini tyto obrázky skutečně vytvoří. Jedná se o zcela nové obrázky. Nejsou to obrázky z internetu. Dokáže s lidmi mluvit obrazem, nejen textem.“
Stejný list však informuje, že si na tuto úžasnou věc coby široká veřejnost budeme moci obdivovat až začátkem roku 2024. Důvodem má být údajně to, že Gemini nezvládal dost dobře vstupy a výstupy v jiném jazyce než je angličtina. Právě za úzkou jazykovou podporu sklidil Bard po svém představení největší kritiku. Google rozhodně nehodlá tuto chybu opakovat.