НБУ курс:

USD

43,47

+0,09

EUR

50,80

+0,04

Наличный курс:

USD

43,65

43,50

EUR

51,15

50,90

Файлы Cookie

Я разрешаю DELO.UA использовать файлы cookie.

Политика конфиденциальности

Укргосархив передал 10 терабайтов данных для обучения национального ИИ "Сяйво"

искусственный интеллект
Украинский ИИ будет учиться на архивных документах / Freepik

Государственная архивная служба Украины передала около 10 терабайтов информации для обучения национальной большой языковой модели (LLM) "Сяйво". Такой объем данных соответствует массиву текстов в 70 000 книг.

Как пишет Delo.ua, об этом сообщила пресс-служба Минцифры.

Целью проекта является создание искусственного интеллекта, понимающего украинский контекст, историю и диалекты без использования перевода с английского языка.

"Для тренировки национальной языковой модели мы собираем данные, чтобы языковая модель была натренирована на уникальном массиве информации. Это государственные документы, научные статьи... исторические материалы, законы, судебные решения", — сообщил и.о. о. министра цифровой трансформации Александра Борнякова.

LLM "Сяйво" будет изучать уникальные наборы данных: исторические источники, рукописи, законы, судебные решения, медиаматериалы, научные статьи и словари. Сейчас более 50 партнеров, среди которых университеты, библиотеки и медиа уже предоставили свои материалы для сбора качественной базы знаний.

Глава Укргосархива Анатолий Хромов отметил, что к концу 2026 года количество цифровых копий в государственных архивах вырастет со 150 млн до более 200 млн.

"Это уникальный случай, когда Укргосархив впервые предоставляет свои данные для развития цифровых сервисов в Украине... К концу 2026 года количество цифровых копий госархивов увеличатся со 150 млн до более 200 млн", - подчеркнул руководитель архива, отметив, что скорость оцифровки архивного наследия в Украине является одной из самых высоких.

Напомним, 30 марта украинцы выбрали название для национальной большой языковой модели искусственного интеллекта через приложение "Дія". В голосовании приняли участие 136 090 пользователей, а победным вариантом стало название "Сяйво" (Siaivo), получившее 22 601 голос.