Видавці почали блокувати Internet Archive через ризик крадіжки їхніх статей штучним інтелектом

Кілька великих видань почали обмежувати доступ Internet Archive до свого контенту через побоювання, що боти компаній, які займаються розробкою штучного інтелекту, можуть використовувати вебсервіс для крадіжки їхніх статей. Про це пише Engadget.

Одне з таких медіа — The Guardian. Керівник відділу бізнес-звʼязків і ліцензування видання Роберт Ган розповів, що багато компаній у сфері ШІ шукають легкодоступні та структуровані бази даних, а прикладний програмний інтерфейс Internet Archive надає все необхідне для «викачування інтелектуальної власності».

Аналогічний крок зробило The New York Times. Представники газети кажуть, що цифровий архів Wayback Machine, що дозволяє переглядати збережені копії вебсторінок, без дозволу надає необмежений доступ до матеріалів NYT, зокрема ШІ-компаніям.

Доступ до свого контенту також обмежили видання Financial Times та соціальна платформа Reddit.

Раніше журналіст The New York Times подав до суду на xAI, Anthropic, Google, OpenAI та інших техногігантів через самовільне використання ними книг, захищених авторським правом, для навчання своїх ШІ-моделей.

Нагадаємо, у жовтні 2025 року Internet Archive відзначив збереження одного трильйона вебсторінок, доступних через сервіс Wayback Machine. Це найбільший обсяг архівованих матеріалів в історії інтернету.

Фото: Shutterstock