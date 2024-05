Společnost OpenAI oznámila GPT-4o, aktualizaci svého jazykového modelu GPT-4, která přináší nové funkce do bezplatné i placené úrovně platformy ChatGPT. Klíčovou změnou, která přichází s uvedením GPT-4o, je možnost zadávat a generovat libovolnou kombinaci textu, zvuku a obrázků. To proto, že OpenAI vycvičila nový model end-to-end, který funguje napříč textem, obrazem i zvukem. Dříve GPT-4 používal samostatné modely pro zvuk, text a obrázky. Díky tomu, že je vše integrováno do jediného modelu, neztrácí ChatGPT podle vysvětlení společnosti OpenAI informace mezi jednotlivými modely, což otevírá řadu nových možností.

GPT-4o přesahuje rámec konverzace a prokazuje schopnosti v oblasti řešení problémů a analýzy. Model dokáže řešit matematické problémy krok za krokem, analyzovat kód, interpretovat grafy a překládat jazyky v reálném čase. Kromě toho dokáže generovat různé hlasové styly.

Zatímco živá ukázka 13. května se zaměřila na to, jak tento jediný model umožňuje používat video k řešení domácích úkolů nebo vést zvukovou konverzaci v reálném čase, pomáhá také napravit něco, v čem je model AI notoricky špatný – umístění textu na obrázek. GPT-4 se může pokusit umístit text, ale obvykle to vede k překlepům, i když chatbotovi přesně řeknete, jak se to má napsat.

Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN



Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx