Буква «o» обозначает Omni, что говорит о возможностях работы ИИ не только с текстом, но и с визуальным контентом и звуком.
Глава OpenAI Грег Брокман продемонстрировал возможности GPT-4o, показав изображение со связным текстом, сгенерированное нейросетью.
На картинке изображен мужчина в футболке с логотипом OpenAI, пишущий текст на доске.
Изображение выглядит впечатляюще и почти как фотография, но опытный пользователь заметит несоответствия. Неестественный угол доски, странная форма кисти человека и неправильное освещение указывают на то, что это сгенерировано ИИ.
Пока что доступ к генерации изображений с помощью GPT-4o закрыт для обычных пользователей. Но компания обещала исправить это в самое ближайшее время.