OpenAI раскошелился на Время

OpenAI договорилась с американским журналом и сайтом Time об обучении ChatGPT на архивном контенте издания. Нейросети будут доступны материалы за 101 год работы издания, а при использовании публикаций в генерации ответов на запросы пользователей ChatGPT будет давать ссылку на оригинал использованных публикаций на сайте издания. И, конечно, контент задействуют для обучения больших языковых моделей (LLM).

Старые проблемы, новые решения

Все это — вариация решения новой проблемы ИИ и авторских прав. Не так давно мы рассказывали о том, что медиахолдинги и авторы начали воевать с разработчиками ИИ из-за незаконного использования контента для обучения генеративных моделей. Весной восемь газет в США подали иск против Microsoft и OpenAI. Ранее с ними же судилась The New York Times из-за обучения нейросетей без разрешения, но натолкнулась на встречное обвинение от OpenAI: якобы газета наняла для взлома продуктов компании хакера, который сам же тексты и загрузил в модель, чтобы у издателей появились улики.

Также с разработчиками пыталась судиться гильдия авторов США и требовала компенсацию — по 150 000 долларов за каждую использованную книгу. Но суд в итоге отклонил иск, не хватило доказательств.

Все эти истории сводятся к тому, что не было бы никаких судов, если бы корпорации сразу пришли к авторам, издательствам — правообладателям — и договорились о плате за контент. Теперь так и происходит, причем журнал Time не стал пионером: ранее OpenAI заключила аналогичные партнерства с Financial Times, медиахолдингом Axel Springer и французским изданием Le Monde.

Где деньги?

Про финансовый аспект сделки почти ничего неизвестно. Стороны не раскрывали детали, а про соглашение с Axel Springer в сети фигурировала оценка контракта в десятки миллионов евро.

В Time говорят, что для них контент «в аренду» — это возможность «улучшить освещение их журналистской деятельности», расширить доступ к достоверной информации по всему миру. Так или иначе этот и другие партнеры OpenAI благодаря ссылкам на оригиналы получат приток новой аудитории, а это хороший бонус к выплате.

Платить готовы не все

От Microsoft, кажется, таких партнерств можно пока не ждать. Мустафа Сулейман, гендиректор нового подразделения Microsoft по ИИ, в июне озвучил довольно жесткую позицию по поводу обучения: использование контента из интернета подпадает под понятие «добросовестного использования», его можно копировать, воссоздавать без ограничений, в том числе для ИИ.

В России до судов и уж тем более до партнерств дело пока не доходило. Холдинг Shkulev Media (NGS.ru, «Фонтанка.ру», Psychologies и другие) ранее запретил нейросетевым сервисам Яндекса и OpenAI показывать информацию с сайтов без их посещения. Это пока единственный громкий кейс по теме, и складывается ощущение, что проблема авторских прав в нашей стране пока не особо актуальна.