- Категория
- Новости
- Дата публикации
- Переключить язык
- Читати українською
EU AI Act. Опубликован шаблон отчета по авторским правам для разработчиков ИИ
Разработчики искусственного интеллекта, использующие данные из онлайн-источников для обучения "ИИ общего назначения" (General Purpose AI – GPAI), теперь обязаны составлять список вебсайтов, из которых они получили наибольший объем данных, и публиковать его на своих вебресурсах – в соответствии с требованиями Регламента ЕС об искусственном интеллекте (EU AI Act).
Об этом пишет Delo.ua со ссылкой на эксклюзив от юрфирмы Pinsent Masons.
Учитывая планы Украины на членство в ЕС, эти регуляторные нормы будут адаптированы и в нашей стране.
Соответствующее требование содержится в новом шаблоне, разработанном для поставщиков GPAI-моделей и который поможет им выполнить обязательства, связанные с авторскими правами. Нормы вступают в силу уже на этой неделе.
Доктор Нилс Рауэр, эксперт по праву интеллектуальной собственности и регулирования ИИ из юридической фирмы Pinsent Masons, пояснил: "Статья 53(1) (d) EU AI Act требует, чтобы все поставщики GPAI-моделей подготовили и обнародовали достаточно подробный публичный обзор контента, использованного для обучения соответствующей модели. Именно офис искусственного интеллекта (AI Office) должен был разработать соответствующий шаблон — и сейчас он опубликован".
По его словам, основная цель законодателя — обеспечить прозрачность в тренировке моделей GPAI, нуждающихся в обработке огромных объемов данных (big data). Согласно преамбуле 107 AI Act, отчет должен охватывать как фазу предварительного обучения, так и основной тренировки, с акцентом на контент, защищенный авторским правом, хотя охватываются и другие типы защищенной информации.
"В итоге это попытка найти баланс между прозрачностью и защитой законных интересов всех сторон, — добавляет Рауэр. — При этом учитывается необходимость для разработчиков защищать свои коммерческие тайны. Шаблон должен стать ориентиром того, какую информацию следует публиковать".
AI Office уточняет: шаблон не обязывает раскрывать конкретные наборы данных или произведения, используемые для обучения. Впрочем, предоставленная информация должна быть "достаточно полной и подробной", чтобы обеспечить прозрачность и дать возможность заинтересованным сторонам защищать свои права в рамках законодательства ЕС.
В шаблоне учтено, что данные для обучения могут поступать из различных источников: публичные наборы данных, частные нелицензированные массивы, взаимодействие с пользователями, синтетические данные или данные, полученные через скрейпинг из вебресурсов.
В случаях, когда данные собираются онлайн, разработчики должны публиковать список наиболее релевантных доменов – топ-10% доменов по объему собранного контента. Для малых и средних компаний (SMEs) это требование снижено – топ-5% или максимум 1000 доменов (в зависимости от меньшего показателя).
Чтобы защитить конфиденциальные данные, в шаблоне предусмотрено, что частные наборы данных, не лицензированные правообладателями, должны указываться только в случаях, когда они публично известны (или когда разработчик хочет их раскрыть). В других случаях достаточно общего описания.
Отчеты должны охватывать все этапы обучения модели, включая предварительный, основной, послетренировочный этап, "тюнинг" и согласование. Если модель только совершенствуется (refining), достаточно указать, какие данные были использованы на этом этапе, со ссылкой на базовую модель. Для distillation (упрощенных моделей) требуется еще меньший объем информации.
Публикация отчета обязательна как на сайте поставщика, так и на других каналах распространения GPAI-модели.
Правила статьи 53 и другие положения, касающиеся GPAI, вступают в силу 2 августа 2025 года. Те модели, которые уже были выведены на рынок к этой дате, должны опубликовать отчеты до 2 августа 2027 года, за исключением отдельных случаев.
Как уточняет европейский ИИ-офис (AI Office), если поставщик модели, выведенной на рынок до 2 августа 2025 года, не может предоставить часть информации даже после приложенных усилий — из-за ее отсутствия или непропорциональной нагрузки — это следует четко указать и обосновать в отчете.
"Фаза предучебы моделей GPAI уже стала предметом судебных разбирательств, — говорит Рауэр. — В частности, в США, а также в Великобритании и Германии, где продолжаются иски против разработчиков GPAI-моделей за нарушение авторских прав и конфиденциальности данных. Конфликт интересов очевиден: с одной стороны – потребность в огромных объемах данных, с другой – права владельцев этих данных".
Нарушение требований шаблона может стоить разработчикам до 3% от их годового мирового оборота или 15 млн евро — в зависимости от того, какая сумма выше. Со 2 августа 2026 года AI Office начнет применять эти штрафы.