ВСЛУХ

OpenAI вот-вот проглотит огромный кусок интернета: что будет дальше и кто остановит американскую компанию?

OpenAI вот-вот проглотит огромный кусок интернета: что будет дальше и кто остановит американскую компанию?
Уверен, 9 из 10 читателей этой статьи ни разу в жизни не слышали о фирме Automattic. А вот она, скорее всего, знает про вас очень много, ведь на ее системах управления контентом (через дочернюю компанию WordPress) крутятся 43 % из 10 миллионов самых популярных сайтов в Мировой паутине. Практически половина.


Кроме того, Automattic владеет приличным списком мегаплатформ, в число которых входит и Tumblr. «Тамблер», сервис микроблогов, конечно, в последний год сильно сдал свои позиции, но 200 миллионов активных пользователей все-таки имеет. А сколько там было зарегистрировано людей за многие годы? Сказать сложно, наверное, полмиллиарда. Во всяком случае, сервис содержит невероятно огромное количество личных сообщений, за некоторые из которых стыдно до сих пор.

Приватность отменяется?


И вот теперь вся эта информация, в том числе и приватная, может быть передана OpenAI и Midjourney, чтобы нейросети на ней обучались. По данным сразу нескольких авторитетных интернет-ресурсов, Automattic вот-вот завершит процесс, возможно, уже на этой неделе.

Для чего это вообще нужно? Большинство людей общаются с ИИ через чат-боты. Это связано с тем, что технологические гиганты прежде всего развивают так называемые большие языковые модели.

Но алгоритмы нужно обучать и распознаванию лиц на основе наших селфи, а также улучшать генерацию изображений и видео, анализируя оригинальные картинки и ролики, которые пользователи загружают в Сеть.

Но вот как и что конкретно происходит с данными, обработанными Midjourney и OpenAI, не знает никто, даже большинство сотрудников этих компаний. По сути, это черный ящик, из которого может выскочить все что угодно.

Так что ChatGPT вполне может использовать в обучении последние слова, которые остановил перед уходом из жизни человек, или диалог, в котором люди решали производственные вопросы, связанные с коммерческой тайной.

Когда Automattic просят прокомментировать доступ ИИ к таким приватным данным, представители компании дают ссылку на страницу под названием «Защита выбора пользователя». Там в настройках конфиденциальности теперь можно включить опцию, которая «препятствует индексации сайтов поисковыми системами на WordPress.com и Tumblr».

Также есть дополнительные настройки, которые могут прямо запретить компаниям, занимающимся искусственным интеллектом, собирать данные пользователей Automattic. Кроме того, фирма обещает уведомлять партнёров, обучающих ИИ, кто из людей запретил доступ к своим данным. И тогда эти партнеры должны не только исключить контент этих пользователей из будущих обучений, но и исключить его из прошлых.

Закон не запрещает


Все это замечательно, но об опциях отказа мало кто знает. Кроме того, нет никаких гарантий, что компании, развивающие нейросети, действительно будут игнорировать данные пользователей-отказников.

Но самое главное: в данный момент не существует закона, который обязывал компании, занимающиеся искусственным интеллектом, учитывать мнение пользователей в данном вопросе. По сути, сейчас конфиденциальности данных не существует, а законодательство катастрофически отстает от скорости развития новых технологий, особенно информационных.

Техногиганты типа OpenAI, Google и Meta* устроили настоящую гонку вооружений в области искусственного интеллекта. При этом обычные люди, которые производят в интернете основную часть контента, оказались в самом центре событий. Практически каждое приложение, сайт или социальная платформа требует, чтобы мы нажали «Да», тем самым полностью согласившись с их условиями. А в них, как оказалось в последнее время, стоит по умолчанию предоставление личных данных для обучения нейросетей.

Любое соглашение, которое мы подписываем в интернете, так или иначе разрешает сайту использовать данные, которые генерируем, с целью монетизации. При этом большинство пользователей вообще не читают, что там написано. Просто максимально быстро проматывают до конца.

Впрочем, многие сайты даже не сообщают своим пользователям, что они предоставляют данные OpenAI / Midjourney. Максимум могут единоразово прислать письмо на электронную почту, которое моментально затеряется в тоннах спама.

А что там, в черном ящике?


Но самое страшное вовсе не это, а то, что совершенно непонятно, чем закончится гонка искусственных интеллектов и нейросетей. Это признают даже лучшие разработчики.

— Наш теоретический анализ очень далек от того, на что способны эти модели. При этом многие модели представляют собой настоящие черные ящики. Да, они выдают полезные результаты, однако сами ученые не понимают, как нейросети это делают, — говорит Михаил Белкин из Калифорнийского технического университета


Белкину можно верить, он является одним из ведущих специалистов в области ИИ. Он утверждает: гарантий, что человечество сможет контролировать свое детище, вообще нет никаких. И не предвидится...

* Признана экстремистской организацией и запрещена в РФ

Автор:

Мы в Мы в Яндекс Дзен
Firefox и Tumblr присоединяются к акции поддержки социальной сети MastodonБольшая часть сотрудников OpenAI угрожает уйти, если правление не уйдет в отставку и не восстановит Сэма Альтмана на посту генерального директора