- Категория
- Техно
- Дата публикации
- Переключить язык
- Читати українською
OpenAI представил модель искусственного интеллекта GPT-4o mini
Компания OpenAI представила новую экономичную модель искусственного интеллекта под названием GPT-4o mini, позволяющую снизить затраты на использование искусственного интеллекта и расширить его применение.
GPT-4o mini продемонстрировала высокие результаты в тестах на понимание и анализ текста, достигнув 82% на MMLU. Такой результат означает, что модель может эффективно понимать и интерпретировать текстовую информацию.
Одним из ключевых преимуществ GPT-4o mini является его доступность. Стоимость обработки информации значительно ниже, чем у предыдущих моделей. OpenAI измеряет объем информации в токенах, примерно соответствующих словам или частям слов. Так, обработка миллиона входных токенов стоит 15 центов (около 6 гривен), а миллион выходных – 60 центов (около 25 гривен).
Следовательно, стоимость GPT-4o mini более чем на 60% ниже GPT-3.5 Turbo, что делает ее привлекательной альтернативой для тех, кто ищет экономически эффективные решения в сфере искусственного интеллекта.
GPT-4o mini поддерживает выполнение задач с низкими затратами и задержками, такие как обработка большого объема контекста, цепные или параллельные вызовы модели (например, использование нескольких API) или взаимодействие с клиентами через быстрые текстовые ответы в режиме реального времени (например, чат-боты) поддержки клиентов).
Модель также поддерживает текст и изображения в API, а в будущем будет поддерживать видео и аудиовходы и выходы. Она имеет контекстное окно на 128 тысяч токенов, поддерживает до 16 тысяч выходных токенов по запросу и имеет знания до октября 2023 года. Улучшенный токенизатор делает обработку текста на других языках более экономичной.
В ChatGPT пользователи тарифных планов Free, Plus и Team уже могут получить доступ к GPT-4o mini вместо GPT-3.5.
OpenAI представил голосовую модель GPT-4o
В мае OpenAI представила еще одну новую модель искусственного интеллекта GPT-4o, которая является голосовым помощником, способным обсуждать аудио, изображения и текст в режиме реального времени. GPT-4o реагирует на аудиовход за 232 миллисекунды, что соответствует скорости реакции человека в разговоре.
Благодаря этой модели пользователи могут общаться с ChatGPT в разговорной манере, даже прерывая его в ответе, а модель демонстрирует адаптивность в реальном времени. GPT-4o также способен распознавать эмоциональные нюансы в голосе и отвечать в разных эмоциональных стилях.
Отмечается, что GPT-4o лучше воспринимает изображение, аудио и другую визуальную информацию по сравнению с предыдущими моделями, что значительно улучшило его возможности в обработке речи. Также новые функции включают загрузку скриншотов и постановку вопросов на их основе, запоминание предыдущих вопросов и возможность выходить непосредственно в интернет.