OpenAI анонсировала новую систему ИИ для преобразования текста в видео

OpenAI
Фото: Depositphotos

Компания OpenAI создала новую систему искусственного интеллекта под названием Sora, способную создавать реалистичные видео на основе текстовых подсказок от пользователей.

Об этом сообщила пресс-служба OpenAI.

По словам главного исполнительного директора OpenAI Сэма Альтмана, изначально Sora будет доступна для ограниченного количества пользователей, в частности для ряда художников, дизайнеров и кинематографистов, которые дадут обратную связь о том, как улучшить модель, чтобы она была наиболее полезна для творческих профессионалов.

Также доступ получит команда экспертов – им будет поручена оценка безопасности системы, прежде чем она будет включена в продукты компании.

В OpenAI отмечают, что эта система ИИ может быстро создавать видео продолжительностью до 1 минуты. В них могут быть сложные сцены с несколькими персонажами, определенными типами движения и точными деталями объекта и фона. Модель понимает не только то, что пользователь написал в запросе, но и как эти вещи существуют в физическом мире.

OpenAI показала видео, созданное с помощью Sora со следующим запросом: "Стильная женщина идет по улице Токио, которая освещена неоном и анимированными вывесками. Она одета в черную кожаную куртку, длинное красное платье и черные сапоги, а также несет черную сумочку. На ней солнцезащитные очки и красная помада. Она идет уверенно и непринужденно. Асфальт влажный и от него отражаются разноцветные огни. Вокруг ходит много пешеходов".

Как отмечают в OpenAI, у нынешней модели есть слабые места. Она может испытывать трудности с точным моделированием физики сложной сцены и может не понимать некоторые причинно-следственные связи. К примеру, человек может откусить кусочек от печенья, но после этого на нем может не быть следа от укуса.

Компания Google объявила о запуске новой версии своей мощной модели искусственного интеллекта, которая может обрабатывать большее количество текста, чем продукты конкурентов, а также видео. Обновленная модель искусственного интеллекта Gemini 1.5 Pro доступна клиентам с 15 февраля.

Также сообщалось, что компания OpenAI объявила о выпуске новой версии чат-бота ChatGPT, которая будет запоминать то, что говорят пользователи, чтобы использовать это в будущих чатах.

Фото: ua.depositphotos.com