Google випускає оновлену модель Gemini 1.5 Pro, здатну обробляти відео

Google випускає оновлену модель Gemini 1.5 Pro, здатну обробляти відео
Google випускає оновлену модель Gemini 1.5 Pro

Компанія Google випускає нову версію своєї потужної моделі штучного інтелекту, яка може обробляти більшу кількість тексту, ніж продукти конкурентів а також відео. Оновлена ​​модель штучного інтелекту Gemini 1.5 Pro буде доступна клієнтам з 15 лютого.

Про це пише Вloomberg.

"Сьогодні ми зосереджуємося перш за все на тому, щоб представити вам дослідження, які створили цю модель, а завтра ми з радістю побачимо, що світ зробить з новими можливостями", — сказав Оріол Віньялс, віце-президент Google і один із технічних керівників Gemini.

За словами Віньялса, Gemini 1.5 Pro можна навчити швидше та ефективніше, і він має здатність обробляти величезну кількість інформації щоразу. Наприклад, розробники можуть використовувати Gemini 1.5 Pro для запиту відео тривалістю до години, 11 годин аудіо або понад 700 000 слів у документі.

За інформацією Google, такий обсяг даних є найдовшим "вікном контексту" з усіх масштабних моделей ШІ. Gemini 1.5 може обробляти набагато більше даних, ніж останні моделі штучного інтелекту від OpenAI і Anthropic.

Google витратив мільярди доларів на розширення можливостей генеративного ШІ та прагне залучити корпоративних клієнтів, щоб показати, що їхні інвестиції окупаються.

Зазначається, що Google намагається показати, що він також є силою в передовій генеративній технології ШІ (не лише OpenAI), яка може створювати новий текст, зображення чи навіть відео на основі підказок користувача.   

Видання пише, що у відеодемонстрації для журналістів інженери Google попросили Gemini 1.5 Pro знайти певну сцену в 44-хвилинному фільмі Бастера Кітона, надавши моделі ШІ приблизний опис сцени, яку вони запам’ятали. Gemini успішно знайшов її, зазначивши, що вона була зображена приблизно через 15 хвилин відео.

Однак Google попередив, що Gemini 1.5 Pro все ще знаходиться на стадії експерименту та дослідження, тому може працювати не коректно. Іноді він працює повільно та не завжди розуміє наміри користувачів, змушуючи їх задавати свої запитання різними способами, перш ніж модель дасть правильну відповідь. 

Віньялс сказав, що компанія працює над оптимізацією продуктивності Gemini 1.5, щоб зробити його ще швидшим.

Нагадаємо, Джек Кравчик, керівник Gemini повідомив, що ШІ (раніше відомий як Bard) став доступний на iOS і Android за межами США через спеціальний застосунок. На Android Gemini буде доступний через спеціальний додаток, а на iOS – через кнопку у застосунку Google.