- Категория
- Новости
- Дата публикации
- Переключить язык
- Читати українською
Укргосархив передал 10 терабайтов данных для обучения национального ИИ "Сяйво"
Государственная архивная служба Украины передала около 10 терабайтов информации для обучения национальной большой языковой модели (LLM) "Сяйво". Такой объем данных соответствует массиву текстов в 70 000 книг.
Как пишет Delo.ua, об этом сообщила пресс-служба Минцифры.
Целью проекта является создание искусственного интеллекта, понимающего украинский контекст, историю и диалекты без использования перевода с английского языка.
"Для тренировки национальной языковой модели мы собираем данные, чтобы языковая модель была натренирована на уникальном массиве информации. Это государственные документы, научные статьи... исторические материалы, законы, судебные решения", — сообщил и.о. о. министра цифровой трансформации Александра Борнякова.
LLM "Сяйво" будет изучать уникальные наборы данных: исторические источники, рукописи, законы, судебные решения, медиаматериалы, научные статьи и словари. Сейчас более 50 партнеров, среди которых университеты, библиотеки и медиа уже предоставили свои материалы для сбора качественной базы знаний.
Глава Укргосархива Анатолий Хромов отметил, что к концу 2026 года количество цифровых копий в государственных архивах вырастет со 150 млн до более 200 млн.
"Это уникальный случай, когда Укргосархив впервые предоставляет свои данные для развития цифровых сервисов в Украине... К концу 2026 года количество цифровых копий госархивов увеличатся со 150 млн до более 200 млн", - подчеркнул руководитель архива, отметив, что скорость оцифровки архивного наследия в Украине является одной из самых высоких.
Напомним, 30 марта украинцы выбрали название для национальной большой языковой модели искусственного интеллекта через приложение "Дія". В голосовании приняли участие 136 090 пользователей, а победным вариантом стало название "Сяйво" (Siaivo), получившее 22 601 голос.