Дипфейки стали еще глубже: Synthesia представляет гиперреалистичные аватары с телами

25.06.2024

Теперь аватары могут петь, танцевать и передвигаться по комнате.

Стартап Synthesia , специализирующийся на создании гиперреалистичных аватаров с помощью искусственного интеллекта, готовится к очередному обновлению. Теперь аватары будут оснащены движущимися телами и жестикулирующими руками, что сделает их еще более реалистичными.

Полнотельные аватары смогут выполнять различные действия, такие как пение с микрофоном или передвижение по комнате, выходя из-за стола. Они смогут выражать более сложные эмоции, включая волнение, страх и нервозность, отмечает Виктор Рипарелли, генеральный директор компании Synthesia. Ожидается, что обновленные аватары будут представлены ближе к концу года.

Джек Сондерс, исследователь из Университета Бата, который не принимал участия в работе Synthesia, высоко оценил новые аватары. По его словам, несмотря на мелкие ошибки, такие как пересечение рук, общая реалистичность впечатляет. "Никто другой пока не способен на такое," — утверждает Сондерс.

Первая версия гиперреалистичных аватаров Synthesia была запущена в апреле. Эти аватары использовали крупные языковые модели для синхронизации мимики и тона голоса с текстом, а диффузионные модели создавали их внешний вид. Однако они показывались только от торса вверх, что несколько снижало реализм.

Для создания полнотелых аватаров Synthesia разрабатывает еще более мощную модель искусственного интеллекта. Пользователи должны будут записывать движения своих тел в студии.

До выхода полнотелых аватаров компания запустит обновленную версию AI-аватаров, которые будут иметь руки и могут сниматься с разных углов. Ранее доступные только в портретном режиме, новые аватары будут выглядеть еще более реалистично. Конкуренты, такие как Hour One, уже запустили подобные аватары с руками, но версия Synthesia будет иметь более естественные движения рук и синхронизацию губ.

Новый процесс создания персонализированных аватаров значительно упрощен. Если ранее требовалось несколько часов записи в студии, то теперь все необходимое можно сделать за 10 минут с помощью цифровой камеры, петличного микрофона и ноутбука. Процесс также включает чтение сценария с выражением согласия на запись и генерацию случайного пароля безопасности.

Обновления позволяют масштабировать производство аватаров и дают моделям ИИ больше возможностей при меньшем количестве данных. Результаты становятся доступны значительно быстрее: если ранее на создание аватара уходило несколько недель, теперь это можно сделать за день.

Тем не менее, самодельные аватары пока не так выразительны, как студийные, и пользователи не могут менять их фоны. Руки анимируются с использованием продвинутой технологии зацикливания, что делает движения более естественными в зависимости от содержания сценария. Однако Викторио Феррари , директор по науке в Synthesia, подчеркивает, что руки сложно анимировать из-за их разнообразных движений.

Несмотря на все достижения, реалистичные аватары создают серьезные риски в эпоху глубоких фейков и онлайн-дезинформации. Synthesia придерживается строгих правил модерации контента, тщательно проверяя клиентов и тип создаваемого ими контента. Например, только аккредитованные новостные агентства могут генерировать новостной контент.

Эти технологические новшества вызывают обеспокоенность по поводу доверия к онлайн-контенту. Джек Сондерс предупреждает: "Люди должны понимать, что нельзя верить всему, что видишь. Сегодня этим занимается Synthesia, а через год другие компании будут делать то же самое и даже лучше."

На перекрестке науки и фантазии — наш канал

Добавить комментарий

Your email address will not be published.

Предыдущая история

Взлом CISA: хакеры получили доступ к данным о химическом оружии

Next Story

GrimResource: безобидный файл MSC стал троянским конем в Windows

Последние из Новшество

Порт Эльга, Якутия и Хабаровский край заключили трехстороннее соглашение на ВЭФ — PrimaMedia.ru

05.09.2024
Трехстороннее соглашение о взаимодействии при реализации инвестиционного проекта "Строительство Тихоокеанской железной дороги" между Правительством Хабаровского края, Правительством Республики Саха (Якутия) и ООО "Порт Эльга"

Amazon и Facebook открещиваются от «Active Listening»: что на самом деле происходит?

03.09.2024
Техгиганты отрицают участие в программе сбора голосовых данных. Медиаконгломерат Cox Media Group разработал инструмент для таргетированной рекламы, вызывающий серьезные опасения относительно конфиденциальности пользователей. Согласно

YouTube должен тормозить: операторам запретили ускорять видео

30.08.2024
Роскомнадзор разослал письмо с призывом прекратить манипуляции с трафиком. Главный радиочастотный центр (ГРЧЦ), подведомственный Роскомнадзору, 28 августа разослал операторам письмо с призывом прекратить использовать

$60 млн убытков и проблемы с доверием: как дела у CrowdStrike после глобального сбоя

30.08.2024
Руководство пересматривает финансовые прогнозы компании на ближайший год. Компания CrowdStrike — компания, занимающаяся кибербезопасностью. Она специализируется на защите от киберугроз, в том числе вредоносного
Перейти кTop