Переосмислення авторського права в контексті створення генеративних моделей штучного інтелекту

Генеративні моделі штучного інтелекту - потужна технологія, на яку людина все більше і більше покладається для розвʼязання широкого спектру задач, як в особистому житті, так і в роботі.  Це відкриває нові горизонти можливостей та разом з тим породжує нові виклики, зокрема і для розробників генеративних моделей штучного інтелекту.

Авторське право та ШІ. Джерело: depositphotos

Однією з найбільш інтригуючих, практично "магічних", здібностей генеративних моделей штучного інтелекту є їх здатність генерувати оригінальний контент (тексти, зображення, відео, музику, тощо).

При цьому, якість згенерованого штучним інтелектом контенту в значній мірі залежить від якості та кількості даних, які були використані для тренування моделі. Так, експериментально доведено, що тренування генеративної моделі штучного інтелекту на даних, що згенеровані нею ж або іншими моделями через кілька повторювань перетворюється на беззмістовну для людини маячню. Отже, з точки тренування моделей цінним є контент створений саме людиною.

Тож, серед правників у сфері авторського права останнім часом точиться дискусія: а чи не порушуються права власників контенту у випадках, коли такий контент використовується для тренування генеративної моделі штучного інтелекту?

Законодавство прямої відповіді на це питання не дає, оскільки сама проблема виникла зовсім недавно. І поки вчені-правники дискутують щодо прийнятного способу  її вирішення - очевидно, що такі підходи формуватимуться у горнилі судових баталій.

Власники авторського контенту вважають, що його використання для тренування генеративних моделей штучного інтелекту порушує їхні майнові права на такий контент і активно подають позови проти власників систем генеративного штучного інтелекту:

  • The New York Times проти OpenAI та Microsoft: В кінці грудня 2023 року The New York Times подала позов про порушення авторських прав проти компанії OpenAI та її засновника Microsoft у звʼязку із тим, що для тренування моделей генеративного штучного інтелекту компанії OpenAI використовувався контент NYT. OpenAI цього не заперечує, проте стверджує, що використання веб-контенту, включаючи статті NYT, є справедливим використанням "необхідним для інноваторів та критичним для конкурентоздатності США".
  • Група художників-графіків проти Stability AI/Midjourney: Троє художників-графіків позиваються до Stability AI Ltd./Midjourney, звинувачуючи компанію в "скрейпінгу" понад 5 мільярдів зображень з Інтернету для тренування свого популярного генератора зображень Stable Diffusion без згоди власників авторських прав на такі зображення.
  • Getty Images проти Stability AI: У лютому фотосток Getty Images подав власний позов проти Stability AI у США, та у Великобританії, стверджуючи, що компанія скопіювала понад 12 мільйонів фотографій з колекції Getty без дозволу останньої та без виплати їх компенсації.
  • Автори-письменники проти OpenAI: У червні два автори з США подали позов проти OpenAI, стверджуючи, що набори даних для тренування генеративної мовної моделі компанії включали майже 300 000 книг, взятих з незаконних "тіньових бібліотек", які пропонують авторські книги.
  • Сара Сільверман та інші автори проти OpenAI та Microsoft: Сара Сільверман та інші автори подали позов проти OpenAI та Meta, материнської компанії Facebook, звинувачуючи їх у тому, що для тренування їхніх чат ботів були використані книги, придбані незаконно на піратських ресурсах.

Наявність таких судових позовів вказує на зростання юридичної боротьби навколо використання авторського контенту без дозволу правовласника для тренування генеративних моделей штучного інтелекту та піднімає питання про межі "справедливого використання" у контексті цієї технології.

Генеративні моделі штучного інтелекту використовують компʼютерні алгоритми для аналізу великих масивів даних, вчаться на прикладах і можуть генерувати новий контент, що імітує людську творчість (тексти, зображення, музику, відео). Ці моделі використовуються у різних галузях, від мистецтва до технологій. У сфері розваг вони можуть створювати тексти, реалістичні візуальні зображення та музику.

Авторське право виникло як правовий механізм, який надає авторам творів мистецтва, літератури, науки, виключні права на створений ними контент. Такі виключні права включають право на відтворення, розповсюдження, публічне виконання та внесення змін до авторських творів. 

З часом, зі зростанням технологій та зміною способів споживання та використання контенту, авторське право еволюціонувало у відповідь новим викликам і потребам суспільства. З появою технології генеративних моделей штучного інтелекту авторське право зіткнулося з новими викликами. 

Крім проблеми авторства обʼєктів, згенерованих системами штучного інтелекту, уваги потребує також питання використання пропрієтарного контенту для тренування AI моделей.

Комплексний аналіз норм Закону України "Про авторське право і суміжні права" дозволяє дійти висновку, що використання авторського контенту для тренування моделей штучного інтелекту може вважатись порушенням авторських прав на такий контент, якщо таке використання не відповідає встановленим законом виняткам і обмеженням.

1.       Право на відтворення: використання авторських творів в процесі тренування генеративної моделі штучного інтелекту може вважатися "відтворенням" таких творів, оскільки може передбачати виготовлення копій твору в різних формах.

2.       Право на переробку: немає підстав стверджувати, що використання творів в процесі тренування генеративних моделей штучного інтелекту є переробкою таких творів, оскільки вона передбачає творче перероблення твору, тобто наявність  безпосередньої участі фізичної особи у створенні похідного твору.

3.       Обмеження майнових прав: існують певні  умови, за яких допускається вільне відтворення авторських творів. Однак, таке відтворення має відповідати ряду критеріїв:  1) відтворення має носити тимчасовий характер; 2) відтворення має бути проміжним або випадковим (додатковими); 3) відтворення має бути складовою та суттєвою частиною технологічного процесу; 4) єдина мета відтворення повинна полягати в тому, щоб сприяти, зокрема, правомірному використанню твору; 5) не повинно мати самостійного економічного значення.

4.       Звичайне використання та законні інтереси. Вільне використання авторських творів для тренування систем генеративного штучного інтелекту допускається за умови, що це не завдає шкоди іншому звичайному використанню авторських творів і не обмежує безпідставно законні інтереси їх власників.

Попри існуючі винятки і обмеження, українське законодавство не дає чіткої відповіді щодо правомірності використання авторського контенту для тренування генеративних моделей штучного інтелекту без згоди власників такого контенту, у звʼязку із чим виникає певна правова невизначеність.

Враховуючи ці аспекти, використання авторського контенту без дозволу його власника для тренування моделей штучного інтелекту може бути ризикованим з точки зору авторського права в Україні.