- Категория
- IT и Телеком
- Дата публикации
- Переключить язык
- Читати українською
Google выпускает обновленную модель Gemini 1.5 Pro, способную обрабатывать видео
Google выпускает новую версию своей мощной модели искусственного интеллекта, которая может обрабатывать большее количество текста, чем продукты конкурентов и видео. Обновленная модель искусственного интеллекта Gemini 1.5 Pro будет доступна клиентам с 15 февраля.
Об этом пишет Вloomberg.
"Сегодня мы сосредотачиваемся, прежде всего, на том, чтобы представить вам исследования, которые создали эту модель, а завтра мы с радостью увидим, что мир сделает с новыми возможностями", - сказал Ориол Виньялс, вице-президент Google и один из технических руководителей Gemini.
По словам Виньялса, Gemini 1.5 Pro можно научить быстрее и эффективнее, и он способен обрабатывать огромное количество информации каждый раз. Например, разработчики могут использовать Gemini 1.5 Pro для запроса видео продолжительностью до часа, 11 часов аудио или более 700 000 слов в документе.
По информации Google, такой объем данных является самым длинным "окном контекста" из всех масштабных моделей ИИ. Gemini 1.5 может обрабатывать гораздо больше данных, чем последние модели искусственного интеллекта от OpenAI и Anthropic.
Google потратил миллиарды долларов на расширение возможностей генеративного ИИ и стремится привлечь корпоративных клиентов, чтобы показать, что их инвестиции окупаются.
Google пытается показать, что он также является силой в передовой генеративной технологии ИИ (не только OpenAI), которая может создавать новый текст, изображение или даже видео на основе подсказок пользователя.
Издание пишет, что в видеодемонстрации для журналистов инженеры Google попросили Gemini 1.5 Pro найти определенную сцену в 44-минутном фильме Бастера Китона, предоставив модели ИИ приблизительное описание сцены, которую они запомнили. Gemini успешно нашел ее, отметив, что она была изображена примерно через 15 минут видео.
Однако Google предупредил, что Gemini 1.5 Pro все еще находится в стадии эксперимента и исследования, поэтому может работать не корректно. Иногда он работает медленно и не всегда понимает намерения пользователей, заставляя их задавать свои вопросы разными способами, прежде чем модель даст правильный ответ.
Виньялс сказал, что компания работает над оптимизацией производительности Gemini 1.5, чтобы сделать его еще быстрее.
Напомним, Джек Кравчик, руководитель Gemini сообщил, что ИИ (ранее известный как Bard) стал доступен на iOS и Android за пределами США через специальное приложение. На Android Gemini будет доступен через специальное приложение, а на iOS – через кнопку в приложении Google.