Известно, что для обучения нейросетей необходим большой объем данных – чем больше информации обрабатывает ИИ, тем он впоследствии эффективнее. Но с источниками новой и доступной информации у компаний, развивающих ИИ, возникают проблемы, поскольку темпы развития технологий опережают создание данных. В связи с этим систематически появляются претензии, что фирмы нарушают авторские права, незаконно применяют ту или иную информацию для обучения ИИ. Например, в конце 2023 года издание The New York Times обвинило OpenAI и Microsoft в использовании миллионов материалов без разрешения. Согласно отчету центра HAI (Human-Centered Artificial Intelligence) Стэнфордского университета, публичные текстовые данные, вероятно, исчерпаются между 2026 и 2032 годами, нехватку изображений и видео разработчики могут ощутить к 2038-2046 годам.
Но есть варианты решения этой проблемы, и один из них – соцсети, где в открытом доступе большие массивы пользовательских данных, причем как текстовых, так и визуальных. Фотографии, видео, посты, новостные статьи, комментарии – все это представляет огромный интерес для создателей генеративного ИИ. Именно поэтому крупнейшие компании из сферы ИИ начали охотиться за соцсетями – покупать их, заключать сделки о сотрудничестве или создавать новые. Например, ИИ-фирма Perplexity подала заявку на покупку TikTok, что может ей открыть доступ к миллиардам видео, а Google начал сотрудничать с Reddit, чтобы использовать платформу для обучения своих алгоритмов.
Но есть фирмы, которым повезло больше. Так, Meta уже имеет социальный капитал в виде Facebook, Instagram, WhatsApp, и она с легкостью может воспользоваться информацией, размещаемой на площадках. Корпорация предупредила пользователей, что на их публикациях обучаются большие языковые модели. Также не дремлет Илон Маск – в конце прошлого месяца его стартап xAI, развивающий чат-бот Grok, купил соцсеть X за $33 млрд. И, кроме финансовой выгоды, получил доступ к архивам твитов за последние 20 лет. Маск подчеркнул, что будущее xAI и X тесно связано. Корпорация Microsoft, владеющая деловой соцсетью LinkedIn, поощряет пользователей и журналистов публиковать больше оригинального контента.
Кроме этого, в СМИ появилась информация, что Сэм Альтман собирается создать соцсеть, похожую на Х. Издание The Verge заявило, что OpenAI либо запустит отдельное приложение, либо интегрирует платформу в ChatGPT. Сам Альтман никак не комментировал эти слухи, но, если что-то подобное появится, очевидно, конкуренция с Маском и Марком Цукербергом только усилится.
Обозреватель Bloomberg Дейв Ли (Dave Lee) считает, что все эти шаги компаний в сфере ИИ говорят о большом спросе на данные. И борьба за них происходит за счет юзеров, которые публикуют информацию в соцсетях для своих целей, а она используется для ИИ. Дейв посоветовал пользователям обращать внимание на политику конфиденциальности, в которую организации незаметно вносят коррективы для своих задач.