Anthropic, одна из ведущих ИИ компаний, согласилась выплатить 1,5 млрд долларов правообладателям книг по коллективному иску авторов.
Компания использовала около 500 тысяч книг, скачанных с пиратских ресурсов, для обучения своих языковых моделей Claude. В пересчете это около 3000 долларов за каждое произведение. По словам адвоката истцов, сумма может стать крупнейшей в истории дел, связанных с нарушением авторских прав. Правда, финального решения от судьи еще нет.
Почему это важно?
Качественные данные — один из ключевых ресурсов для создания конкурентоспособных ИИ-моделей. Книги остаются одним из источников таких данных, однако до сих пор нет четких правовых рамок, регулирующих их использование (и использование других охраняемых материалов) в обучении нейросетей.
Ранее некоторые правообладатели потребовали полного запрета на применение книг при обучении LLM, но американский суд признал это использование подпадающим под доктрину fair use. Судья сравнил работу модели с «читателем, мечтающим стать писателем». При этом сам факт fair use не отменяет необходимости компенсации авторам. Об этом более подробно мы писали здесь.
Соглашение Anthropic с правообладателями может стать очередным шагом в формировании правил использования контента для развития искусственного интеллекта.