Категорія: ІТ та Телеком
Дата публікації: 16 лютого 2024
Змінити мову: Читать на русском

OpenAI анонсувала нову систему ШІ для перетворення текста у відео

Компанія OpenAI створила нову систему штучного інтелекту під назвою Sora, яка здатна створювати реалістичні відео на основі текстових підказок від користувачів.

Про це повідомила пресслужба OpenAI.

За словами головного виконавчого директора OpenAI Сема Альтмана, спочатку Sora буде доступна для обмеженої кількості користувачів, зокрема для ряду художників, дизайнерів та кінематографістів, які дадуть зворотний зв'язок про те, як покращити модель, щоб вона була найбільш корисною для творчих професіоналів.

Також доступ отримає команда експертів – їм буде доручена оцінка безпеки системи, перш ніж вона буде включена у продукти компанії.

У OpenAI зазначають, що ця система ШІ може швидко створювати відео тривалістю до 1 хвилини. В них можуть бути присутні складні сцени з кількома персонажами, певними типами руху та точними деталями об'єкта та фону. Модель розуміє не тільки те, що користувач написав у запиті, а й те, як ці речі існують у фізичному світі.

OpenAI показала відео, створене за допомогою Sora з наступним запитом: "Стильна жінка йде вулицею Токіо, яка освітлена неоном і анімованими вивісками. Вона вдягнена у чорну шкіряну куртку, довгу червону сукню та чорні чоботи, а також несе чорну сумочку. Вона носить сонцезахисні окуляри та червону помаду. Вона йде впевнено та невимушено. Асфальт вологий і від нього відбиваються різнокольорові вогні. Навколо ходить багато пішоходів".

Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024

Як зазначають у OpenAI, нинішня модель має слабкі місця. Вона може відчувати труднощі з точним моделюванням фізики складної сцени і може не розуміти деякі причинно-наслідкові зв’язки. Наприклад, людина може відкусити шматочок від печива, але після цього на ньому може не бути сліду від укусу.

Нагадаємо, компанія Google оголосила про запуск нової версії своєї потужної моделі штучного інтелекту, яка може обробляти більшу кількість тексту, ніж продукти конкурентів, а також відео. Оновлена модель штучного інтелекту Gemini 1.5 Pro доступна клієнтам з 15 лютого.

Також повідомлялося, що компанія OpenAI оголосила про випуск нової версії чат-боту ChatGPT, яка буде запам'ятовувати те, що кажуть користувачі, щоб застосовувати це у майбутніх чатах.

Фото: ua.depositphotos.com

Автор:: Ольга Колесніченко