Теперь люди могут чувствовать себя неловко, если они считают, что глубокие или даже нелепые разговоры, которые они вели с ChatGPT, останутся скрытыми навсегда. В связи с продолжающимся спором об авторских правах суд Нью-Йорка обязал OpenAI передать около двадцати миллионов журналов чатов адвокатам, представляющим такие СМИ, как Chicago Tribune и New York Times. Несмотря на то, что данные будут анонимизированы, здесь все еще происходит обмен большим количеством информации. Остается под вопросом, может ли анонимизация обычных пользователей быть действительно успешной, учитывая такой объем.
Предыстория дела - судебный иск, в котором медиа-компании обвиняют OpenAI в использовании их статей для обучения ИИ без разрешения. Истцы хотят использовать логи чатов, чтобы доказать, что ChatGPT регулярно воспроизводит защищенный авторским правом контент, а не только тогда, когда бот вынужден делать это с помощью целенаправленных манипуляций ("взлома"), как утверждал OpenAI. Судья Сидни Х. Стайн подтвердил ранее вынесенное постановление и отмахнулся от опасений OpenAI. По мнению OpenAI, сбор данных был слишком обременительным и мог нарушить конфиденциальность клиентов.
Суд посчитал иначе и решил, что анонимизация данных является достаточной защитной мерой и что важность для судебного процесса перевешивает риски. Для OpenAI это юридическое поражение, которое эксперты по безопасности уже называют фиаско. Доктор Колоченко из ImmuniWeb отметил, что это, скорее всего, вдохновит подражателей в аналогичных случаях. Это решение существенно нарушает конфиденциальность пользователей, независимо от того, содержат ли 20 миллионов наборов данных взрывоопасные нарушения авторских прав.







