Категорія: Новини
Дата публікації: 29 липня 2025
Змінити мову: Читать на русском

EU AI Act. Опубліковано шаблон звіту щодо авторських прав для розробників ШІ

Будівля Берлемон – це штаб-квартира Європейської комісії. Фото: Kyle Wagaman / Flickr

Розробники штучного інтелекту, які використовують дані з онлайн-джерел для навчання "ШІ загального призначення" (General Purpose AI - GPAI), тепер зобов’язані складати список вебсайтів, з яких вони отримали найбільший обсяг даних, і публікувати його на своїх вебресурсах — відповідно до вимог Регламенту ЄС про штучний інтелект (EU AI Act).

Про це пише Delo.ua з посиланням на ексклюзив від юрфірми Pinsent Masons.

Враховуючи плани України на членство в ЄС, ці регуляторні норми згодом будуть адаптовані і в нашій країні.

Відповідна вимога міститься у новому шаблоні, який розроблено для постачальників GPAI-моделей і який допоможе їм виконати зобов’язання, пов’язані з авторськими правами. Норми набирають чинності вже цього тижня.

Доктор Нілс Рауер, експерт з права інтелектуальної власності та регулювання ШІ з юридичної фірми Pinsent Masons, пояснив: "Стаття 53(1)(d) EU AI Act вимагає, щоб усі постачальники GPAI-моделей підготували та оприлюднили достатньо детальний публічний огляд контенту, використаного для навчання відповідної моделі. Саме Офіс штучного інтелекту (AI Office) мав розробити відповідний шаблон — і наразі його опубліковано".

За його словами, основна мета законодавця — забезпечити прозорість у тренуванні моделей GPAI, які потребують обробки величезних обсягів даних (big data). Відповідно до преамбули 107 AI Act, звіт має охоплювати як фазу попереднього навчання, так і основного тренування, з акцентом на контент, захищений авторським правом, хоча охоплюються також інші типи захищеної інформації.

Останні новини

Всі новини

"У підсумку це спроба знайти баланс між прозорістю та захистом законних інтересів усіх сторін, — додає Рауер. — При цьому враховується необхідність для розробників захищати свої комерційні таємниці. Шаблон має стати орієнтиром щодо того, яку інформацію слід публікувати".

AI Office уточнює: шаблон не зобов’язує розкривати конкретні набори даних або твори, що використовувалися для навчання. Втім, надана інформація має бути "достатньо повною та детальною", аби забезпечити прозорість і дати змогу зацікавленим сторонам захищати свої права в межах законодавства ЄС.

У шаблоні враховано, що дані для навчання можуть надходити з різних джерел: публічні набори даних, приватні неліцензовані масиви, взаємодія з користувачами, синтетичні дані, або ж дані, отримані через скрейпінг із вебресурсів.

У випадках, коли дані збираються онлайн, розробники мають публікувати перелік найбільш релевантних доменів — топ-10% доменів за обсягом зібраного контенту. Для малих і середніх компаній (SMEs) ця вимога знижена — топ-5% або максимум 1000 доменів (залежно від меншого показника).

Щоб захистити конфіденційні дані, у шаблоні передбачено, що приватні набори даних, не ліцензовані правовласниками, мають зазначатися лише у випадках, коли вони є публічно відомими (або коли розробник хоче їх розкрити). В інших випадках — достатньо загального опису.

Звіти мають охоплювати всі етапи навчання моделі, включно з попереднім, основним, післятренувальним етапами, "тюнінгом" та узгодженням. Якщо модель лише вдосконалюється (refining), достатньо вказати, які дані були використані на цьому етапі, з посиланням на базову модель. Для distillation (спрощених моделей) вимагається ще менший обсяг інформації.

Публікація звіту є обов’язковою як на сайті постачальника, так і на інших каналах розповсюдження GPAI-моделі.

Правила статті 53 та інші положення, що стосуються GPAI, набирають чинності 2 серпня 2025 року. Ті моделі, що вже були виведені на ринок до цієї дати, мають опублікувати звіти до 2 серпня 2027 року — за винятком окремих випадків.

Як уточнює європейський ШІ-офіс (AI Office), якщо постачальник моделі, виведеної на ринок до 2 серпня 2025 року, не може надати частину інформації навіть після докладених зусиль — через її відсутність або непропорційне навантаження, — це слід чітко вказати й обґрунтувати у звіті.

"Фаза переднавчання моделей GPAI вже стала предметом судових розглядів, — каже Рауер. — Зокрема, у США, а також у Великій Британії та Німеччині, де тривають позови проти розробників GPAI-моделей за порушення авторських прав і конфіденційності даних. Конфлікт інтересів очевидний: з одного боку — потреба у величезних обсягах даних, з іншого — права власників цих даних".

Порушення вимог шаблону може коштувати розробникам до 3% від їхнього річного світового обороту або €15 млн — залежно від того, яка сума вища. З 2 серпня 2026 року AI Office почне застосовувати ці штрафи.

штучний інтелект

Автор:: Кейт Щеглова