Завантажити ще

Битва за авторські права - найвідоміші словник і енциклопедія подали позов проти ChatGPT

Битва за авторські права - найвідоміші словник і енциклопедія подали позов проти ChatGPT
Фото: herbinisaac з сайту Pixabay

Найвідоміші у світі енциклопедія та словник - Encyclopaedia Britannica та Merriam-Webster - звернулися до суду з позовом проти OpenAI, заявивши про несанкціоноване використання великого масиву їхніх матеріалів для тренування моделей штучного інтелекту, включно з ChatGPT. Цей процес може суттєво змінити підходи до використання цифрового контенту в усій сфері ШІ. Про це пише Digital Trends.

Загальновизнано, що компанії у сфері штучного інтелекту використовують веб-статті для навчання своїх моделей без оплати авторам і без отримання дозволу. Такі видавці, як The New York Times, Chicago Tribune та Toronto Star вже подали судові позови проти цієї практики.

Видання TechCrunch повідомляє, що Encyclopaedia Britannica та її дочірня компанія Merriam-Webster подали позов проти OpenAI. Вони стверджують, що AI-гігант здійснив "масштабне порушення авторських прав", зібравши та використавши майже 100 000 їхніх онлайн-статей для навчання великих мовних моделей без дозволу.

Britannica заявляє, що ChatGPT генерує відповіді, які фактично замінюють її контент, зменшуючи трафік на сайт і потенційні доходи. Якщо користувачі можуть поставити запитання ChatGPT і отримати відповідь на основі статей Britannica, то у них зникає стимул відвідувати сайт безпосередньо.

У позові також згадується використання контенту Britannica у процесі RAG (retrieval-augmented generation), коли ШІ під час відповіді сканує веб для отримання актуальної інформації. Позивачі стверджують, що в цьому процесі система частково або повністю відтворює їхній контент.

Britannica також звинувачує OpenAI у порушенні законодавства про торговельні марки. Компанія стверджує, що ChatGPT інколи вигадує інформацію, а потім помилково приписує її видавцю. За словами Britannica, такі "галюцинації" ставлять під загрозу "подальший доступ громадськості до якісної та достовірної онлайн-інформації".

Наразі не існує чіткої юридичної практики, яка б однозначно визначила, чи є навчання ШІ на захищеному авторським правом контенті порушенням закону. Правове поле тут залишається доволі нечітким.

У нещодавній справі проти Anthropic федеральний суддя постановив, що використання захищеного контенту для навчання може вважатися достатньо "трансформативним", щоб бути законним. Водночас той самий суддя визнав, що компанія незаконно завантажила мільйони книжок, що призвело до врегулювання справи на суму 1,5 млрд доларів із постраждалими авторами.

Оскільки ця тема продовжує розвиватися, законодавцям ще належить виконати значну роботу. Рішення у цих справах, ймовірно, визначать, як саме AI-компанії зможуть легально використовувати веб-контент у майбутньому.