- Категорія
- Новини
- Дата публікації
- Змінити мову
- Читать на русском
EU AI Act. Опубліковано шаблон звіту щодо авторських прав для розробників ШІ
Розробники штучного інтелекту, які використовують дані з онлайн-джерел для навчання "ШІ загального призначення" (General Purpose AI - GPAI), тепер зобов’язані складати список вебсайтів, з яких вони отримали найбільший обсяг даних, і публікувати його на своїх вебресурсах — відповідно до вимог Регламенту ЄС про штучний інтелект (EU AI Act).
Про це пише Delo.ua з посиланням на ексклюзив від юрфірми Pinsent Masons.
Враховуючи плани України на членство в ЄС, ці регуляторні норми згодом будуть адаптовані і в нашій країні.
Відповідна вимога міститься у новому шаблоні, який розроблено для постачальників GPAI-моделей і який допоможе їм виконати зобов’язання, пов’язані з авторськими правами. Норми набирають чинності вже цього тижня.
Доктор Нілс Рауер, експерт з права інтелектуальної власності та регулювання ШІ з юридичної фірми Pinsent Masons, пояснив: "Стаття 53(1)(d) EU AI Act вимагає, щоб усі постачальники GPAI-моделей підготували та оприлюднили достатньо детальний публічний огляд контенту, використаного для навчання відповідної моделі. Саме Офіс штучного інтелекту (AI Office) мав розробити відповідний шаблон — і наразі його опубліковано".
За його словами, основна мета законодавця — забезпечити прозорість у тренуванні моделей GPAI, які потребують обробки величезних обсягів даних (big data). Відповідно до преамбули 107 AI Act, звіт має охоплювати як фазу попереднього навчання, так і основного тренування, з акцентом на контент, захищений авторським правом, хоча охоплюються також інші типи захищеної інформації.
"У підсумку це спроба знайти баланс між прозорістю та захистом законних інтересів усіх сторін, — додає Рауер. — При цьому враховується необхідність для розробників захищати свої комерційні таємниці. Шаблон має стати орієнтиром щодо того, яку інформацію слід публікувати".
AI Office уточнює: шаблон не зобов’язує розкривати конкретні набори даних або твори, що використовувалися для навчання. Втім, надана інформація має бути "достатньо повною та детальною", аби забезпечити прозорість і дати змогу зацікавленим сторонам захищати свої права в межах законодавства ЄС.
У шаблоні враховано, що дані для навчання можуть надходити з різних джерел: публічні набори даних, приватні неліцензовані масиви, взаємодія з користувачами, синтетичні дані, або ж дані, отримані через скрейпінг із вебресурсів.
У випадках, коли дані збираються онлайн, розробники мають публікувати перелік найбільш релевантних доменів — топ-10% доменів за обсягом зібраного контенту. Для малих і середніх компаній (SMEs) ця вимога знижена — топ-5% або максимум 1000 доменів (залежно від меншого показника).
Щоб захистити конфіденційні дані, у шаблоні передбачено, що приватні набори даних, не ліцензовані правовласниками, мають зазначатися лише у випадках, коли вони є публічно відомими (або коли розробник хоче їх розкрити). В інших випадках — достатньо загального опису.
Звіти мають охоплювати всі етапи навчання моделі, включно з попереднім, основним, післятренувальним етапами, "тюнінгом" та узгодженням. Якщо модель лише вдосконалюється (refining), достатньо вказати, які дані були використані на цьому етапі, з посиланням на базову модель. Для distillation (спрощених моделей) вимагається ще менший обсяг інформації.
Публікація звіту є обов’язковою як на сайті постачальника, так і на інших каналах розповсюдження GPAI-моделі.
Правила статті 53 та інші положення, що стосуються GPAI, набирають чинності 2 серпня 2025 року. Ті моделі, що вже були виведені на ринок до цієї дати, мають опублікувати звіти до 2 серпня 2027 року — за винятком окремих випадків.
Як уточнює європейський ШІ-офіс (AI Office), якщо постачальник моделі, виведеної на ринок до 2 серпня 2025 року, не може надати частину інформації навіть після докладених зусиль — через її відсутність або непропорційне навантаження, — це слід чітко вказати й обґрунтувати у звіті.
"Фаза переднавчання моделей GPAI вже стала предметом судових розглядів, — каже Рауер. — Зокрема, у США, а також у Великій Британії та Німеччині, де тривають позови проти розробників GPAI-моделей за порушення авторських прав і конфіденційності даних. Конфлікт інтересів очевидний: з одного боку — потреба у величезних обсягах даних, з іншого — права власників цих даних".
Порушення вимог шаблону може коштувати розробникам до 3% від їхнього річного світового обороту або €15 млн — залежно від того, яка сума вища. З 2 серпня 2026 року AI Office почне застосовувати ці штрафи.