Україна робить потужний крок у сфері цифрових технологій. Мета – увійти до топ-3 країн за розвитком штучного інтелекту у світі. Головним інструментом для цього стане запуск національної великої мовної моделі (LLM), навченої на унікальних українських даних.

Як пише Delo.ua, про це повідомив перший віцепрем’єр - міністр цифрової трансформації Михайло Федоров.

Хто створює український ШІ?

Розробка такої моделі — це надскладний процес, що потребує величезних ресурсів. Оскільки під час війни державні кошти спрямовані на оборону, технічним партнером проєкту став "Київстар". Компанія фінансує розробку, щоб згодом передати готовий продукт державі.

"Упродовж цього часу проєкт пройшов шлях від концепції до впровадження конкретних технічних рішень. Зараз команди переходять до ключового етапу — масштабної підготовки даних і формування стандартів якості майбутньої моделі", — йдеться у пресрелізі "Київстару".

В основі національної системи лежить сімейство моделей Gemma від Google — стратегічного партнера України. Ці передові технології зараз активно адаптуються під українську мову та наш унікальний соціокультурний контекст.

На якому етапі розробка?

Зараз триває "велике навчання". Для того, щоб ШІ був розумним, йому недостатньо просто знань з інтернету. Розробники працюють із терабайтами унікальних даних від медіа, університетів та державних органів.

Вже у січні 2026 року проєкт матиме:

першу базу текстів для глибокого тренування;

покращений токенізатор — інструмент, що дозволяє моделі обробляти українську мову значно швидше за конкурентів;

власні бенчмарки — спеціальні тести для перевірки якості та етичності ШІ.

Якість розробки контролює група незалежних експертів. Вони перевіряють, наскільки модель безпечна, чи не порушує вона етичні норми та наскільки глибоко розуміє національні нюанси, які часто пропускають закордонні аналоги.

Паралельно формується юридична рамка, яка забезпечить прозору та безпечну роботу з даними, а також дотримання вимог законодавства у сфері інтелектуальної власності.

Коли тестування LLM?

Графік розробки чітко розпланований:

Січень 2026 — початок великого голосування. Назву для українського штучного інтелекту оберуть самі громадяни через застосунок "Дія". Весна 2026 — запуск публічного бета-тестування.

Раніше повідомлялося, що першу національну українську велику мовну модель (LLM), на кшталт чат-боту ChatGPT від американського техногіганта OpenAI, тренуватимуть на моделі Gemma від Google.