Wikipedia раскрывает несколько сделок с гигантами ИИ для использования своего контента

2026-01-18 15:30:57

Вкратце

Фонд Викимедиа объявил о ряде партнерств с компаниями в области искусственного интеллекта для использования его контента в обучении больших языковых моделей.
Компании в области ИИ подписались на его корпоративный продукт для масштабного повторного использования контента Википедии.
В октябре прошлого года фонд заявил, что посещаемость сайта снижается из-за того, что люди используют AI-сводки вместо посещения сайта.

Фонд Викимедиа объявил о серии новых партнерств с компаниями в области искусственного интеллекта, которые позволят им использовать контент Википедии для обучения и работы своих AI-моделей, поскольку некоммерческая организация стремится укрепить свою долгосрочную устойчивость на фоне меняющегося поведения онлайн. Соглашения были подписаны через Wikimedia Enterprise, коммерческий продукт фонда, предназначенный для крупных повторных пользователей и распространителей контента проектов Викимедиа. Среди новых участников — Ecosia, Microsoft, Mistral AI, Perplexity, Pleias и ProRata. Они присоединяются к существующим партнерам, таким как Amazon, Google и Meta. «В эпоху ИИ Википедия и её созданные и курируемые человеком знания никогда не были так ценны», — говорится в заявлении фонда. «Её знания[s] генерируют чат-боты на базе ИИ, поисковые системы, голосовые помощники и многое другое. Википедия — один из самых качественных наборов данных, используемых для обучения больших языковых моделей.»

Объявление было сделано в рамках обновления, приуроченного к 25-летию Википедии. Онлайн-энциклопедия входит в десятку самых посещаемых сайтов в мире и является единственным в этой группе, управляемым некоммерческой организацией. Более 65 миллионов статей, опубликованных на более чем 300 языках, просматриваются почти 15 миллиардов раз каждый месяц, по данным фонда. Однако он предупредил, что паттерны трафика меняются. В октябре было сообщено, что человеческие посещения Википедии снизились на 8% по сравнению с прошлым годом, что объясняется тем, что пользователи полагаются на AI-сводки вместо прямого посещения сайта. Почти 60% поисковых запросов в Google заканчиваются без клика, а ответы на странице часто основаны на контенте Википедии.

AI против издателей Сделки происходят на фоне более широких дебатов о том, как компании в области ИИ получают обучающие данные. Большие языковые модели обычно обучаются на огромных объемах онлайн-материалов, что вызывает критику со стороны авторов, издателей и других правообладателей, которые утверждают, что использование защищенных авторским правом работ без разрешения является нарушением. Среди них Reddit участвует в нескольких судебных исках против компаний в области ИИ за использование его контента для обучения моделей, хотя он достиг соглашений о лицензировании с такими компаниями, как Google. В четверг крупные издатели книг Hachette Book Group и Cengage Group подали ходатайство о присоединении к существующему коллективному иску против Google, обвиняя компанию в «историческом нарушении авторских прав» при создании платформы Gemini AI. Иск утверждает, что Google копировал книги без соответствующих лицензий во время обучения своих AI-моделей. Изначально иск был подан в 2023 году группой авторов. OpenAI сталкивается с аналогичным делом со стороны истцов, включая автора "Игры престолов" Джорджа Р.Р. Мартина. Развлекательные компании также поднимают этот вопрос. В середине декабря Disney отправила Google письмо с требованием прекратить нарушение авторских прав, несмотря на то, что Disney заключила отдельную лицензионную сделку с OpenAI, охватывающую сотни персонажей для AI-сгенерированного видео. Disney также направила аналогичные уведомления другим компаниям в области ИИ и участвует в судебных разбирательствах вместе с крупными студиями против компании Midjourney, занимающейся генерацией изображений. В тот же месяц коалиция писателей, актеров и технологов запустила новую отраслевую группу, направленную на установление обязательных стандартов в области обучения и использования ИИ в развлекательной индустрии. Более 500 известных личностей поддержали инициативу, в том числе Натали Портман, Кейт Бланшетт, Бен Аффлек, Гильермо дель Торо и Тайка Вайтити. Европейская комиссия также начала официальное антимонопольное расследование, чтобы определить, нарушил ли Google правила конкуренции ЕС, используя контент издателей и YouTube для работы своих AI-сервисов без справедливой компенсации или согласия. Будет ли правообладатели в конечном итоге иметь возможность найти правовое решение, пока не ясно. Федеральные судьи в США недавно вынесли частичные победы Meta и Anthropic, постановив, что их использование защищенных авторским правом книг для обучения AI-моделей является допустимым использованием, при этом критикуя компании за ведение постоянных библиотек пиратских работ.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

комментарий

0/400

Нет комментариев