
OpenAI вот-вот проглотит огромный кусок интернета: что будет дальше и кто остановит американскую компанию?
Уверен, 9 из 10 читателей этой статьи ни разу в жизни не слышали о фирме Automattic. А вот она, скорее всего, знает про вас очень много, ведь на ее системах управления контентом (через дочернюю компанию WordPress) крутятся 43 % из 10 миллионов самых популярных сайтов в Мировой паутине. Практически половина.
Кроме того, Automattic владеет приличным списком мегаплатформ, в число которых входит и Tumblr. «Тамблер», сервис микроблогов, конечно, в последний год сильно сдал свои позиции, но 200 миллионов активных пользователей все-таки имеет. А сколько там было зарегистрировано людей за многие годы? Сказать сложно, наверное, полмиллиарда. Во всяком случае, сервис содержит невероятно огромное количество личных сообщений, за некоторые из которых стыдно до сих пор.
И вот теперь вся эта информация, в том числе и приватная, может быть передана OpenAI и Midjourney, чтобы нейросети на ней обучались. По данным сразу нескольких авторитетных интернет-ресурсов, Automattic вот-вот завершит процесс, возможно, уже на этой неделе.
Для чего это вообще нужно? Большинство людей общаются с ИИ через чат-боты. Это связано с тем, что технологические гиганты прежде всего развивают так называемые большие языковые модели.
Но алгоритмы нужно обучать и распознаванию лиц на основе наших селфи, а также улучшать генерацию изображений и видео, анализируя оригинальные картинки и ролики, которые пользователи загружают в Сеть.
Но вот как и что конкретно происходит с данными, обработанными Midjourney и OpenAI, не знает никто, даже большинство сотрудников этих компаний. По сути, это черный ящик, из которого может выскочить все что угодно.
Так что ChatGPT вполне может использовать в обучении последние слова, которые остановил перед уходом из жизни человек, или диалог, в котором люди решали производственные вопросы, связанные с коммерческой тайной.
Когда Automattic просят прокомментировать доступ ИИ к таким приватным данным, представители компании дают ссылку на страницу под названием «Защита выбора пользователя». Там в настройках конфиденциальности теперь можно включить опцию, которая «препятствует индексации сайтов поисковыми системами на WordPress.com и Tumblr».
Также есть дополнительные настройки, которые могут прямо запретить компаниям, занимающимся искусственным интеллектом, собирать данные пользователей Automattic. Кроме того, фирма обещает уведомлять партнёров, обучающих ИИ, кто из людей запретил доступ к своим данным. И тогда эти партнеры должны не только исключить контент этих пользователей из будущих обучений, но и исключить его из прошлых.
Все это замечательно, но об опциях отказа мало кто знает. Кроме того, нет никаких гарантий, что компании, развивающие нейросети, действительно будут игнорировать данные пользователей-отказников.
Но самое главное: в данный момент не существует закона, который обязывал компании, занимающиеся искусственным интеллектом, учитывать мнение пользователей в данном вопросе. По сути, сейчас конфиденциальности данных не существует, а законодательство катастрофически отстает от скорости развития новых технологий, особенно информационных.
Техногиганты типа OpenAI, Google и Meta* устроили настоящую гонку вооружений в области искусственного интеллекта. При этом обычные люди, которые производят в интернете основную часть контента, оказались в самом центре событий. Практически каждое приложение, сайт или социальная платформа требует, чтобы мы нажали «Да», тем самым полностью согласившись с их условиями. А в них, как оказалось в последнее время, стоит по умолчанию предоставление личных данных для обучения нейросетей.
Любое соглашение, которое мы подписываем в интернете, так или иначе разрешает сайту использовать данные, которые генерируем, с целью монетизации. При этом большинство пользователей вообще не читают, что там написано. Просто максимально быстро проматывают до конца.
Впрочем, многие сайты даже не сообщают своим пользователям, что они предоставляют данные OpenAI / Midjourney. Максимум могут единоразово прислать письмо на электронную почту, которое моментально затеряется в тоннах спама.
Но самое страшное вовсе не это, а то, что совершенно непонятно, чем закончится гонка искусственных интеллектов и нейросетей. Это признают даже лучшие разработчики.
Белкину можно верить, он является одним из ведущих специалистов в области ИИ. Он утверждает: гарантий, что человечество сможет контролировать свое детище, вообще нет никаких. И не предвидится...
* Признана экстремистской организацией и запрещена в РФ
Кроме того, Automattic владеет приличным списком мегаплатформ, в число которых входит и Tumblr. «Тамблер», сервис микроблогов, конечно, в последний год сильно сдал свои позиции, но 200 миллионов активных пользователей все-таки имеет. А сколько там было зарегистрировано людей за многие годы? Сказать сложно, наверное, полмиллиарда. Во всяком случае, сервис содержит невероятно огромное количество личных сообщений, за некоторые из которых стыдно до сих пор.
Приватность отменяется?
И вот теперь вся эта информация, в том числе и приватная, может быть передана OpenAI и Midjourney, чтобы нейросети на ней обучались. По данным сразу нескольких авторитетных интернет-ресурсов, Automattic вот-вот завершит процесс, возможно, уже на этой неделе.
Для чего это вообще нужно? Большинство людей общаются с ИИ через чат-боты. Это связано с тем, что технологические гиганты прежде всего развивают так называемые большие языковые модели.
Но алгоритмы нужно обучать и распознаванию лиц на основе наших селфи, а также улучшать генерацию изображений и видео, анализируя оригинальные картинки и ролики, которые пользователи загружают в Сеть.
Но вот как и что конкретно происходит с данными, обработанными Midjourney и OpenAI, не знает никто, даже большинство сотрудников этих компаний. По сути, это черный ящик, из которого может выскочить все что угодно.
Так что ChatGPT вполне может использовать в обучении последние слова, которые остановил перед уходом из жизни человек, или диалог, в котором люди решали производственные вопросы, связанные с коммерческой тайной.
Когда Automattic просят прокомментировать доступ ИИ к таким приватным данным, представители компании дают ссылку на страницу под названием «Защита выбора пользователя». Там в настройках конфиденциальности теперь можно включить опцию, которая «препятствует индексации сайтов поисковыми системами на WordPress.com и Tumblr».
Также есть дополнительные настройки, которые могут прямо запретить компаниям, занимающимся искусственным интеллектом, собирать данные пользователей Automattic. Кроме того, фирма обещает уведомлять партнёров, обучающих ИИ, кто из людей запретил доступ к своим данным. И тогда эти партнеры должны не только исключить контент этих пользователей из будущих обучений, но и исключить его из прошлых.
Закон не запрещает
Все это замечательно, но об опциях отказа мало кто знает. Кроме того, нет никаких гарантий, что компании, развивающие нейросети, действительно будут игнорировать данные пользователей-отказников.
Но самое главное: в данный момент не существует закона, который обязывал компании, занимающиеся искусственным интеллектом, учитывать мнение пользователей в данном вопросе. По сути, сейчас конфиденциальности данных не существует, а законодательство катастрофически отстает от скорости развития новых технологий, особенно информационных.
Техногиганты типа OpenAI, Google и Meta* устроили настоящую гонку вооружений в области искусственного интеллекта. При этом обычные люди, которые производят в интернете основную часть контента, оказались в самом центре событий. Практически каждое приложение, сайт или социальная платформа требует, чтобы мы нажали «Да», тем самым полностью согласившись с их условиями. А в них, как оказалось в последнее время, стоит по умолчанию предоставление личных данных для обучения нейросетей.
Любое соглашение, которое мы подписываем в интернете, так или иначе разрешает сайту использовать данные, которые генерируем, с целью монетизации. При этом большинство пользователей вообще не читают, что там написано. Просто максимально быстро проматывают до конца.
Впрочем, многие сайты даже не сообщают своим пользователям, что они предоставляют данные OpenAI / Midjourney. Максимум могут единоразово прислать письмо на электронную почту, которое моментально затеряется в тоннах спама.
А что там, в черном ящике?
Но самое страшное вовсе не это, а то, что совершенно непонятно, чем закончится гонка искусственных интеллектов и нейросетей. Это признают даже лучшие разработчики.
— Наш теоретический анализ очень далек от того, на что способны эти модели. При этом многие модели представляют собой настоящие черные ящики. Да, они выдают полезные результаты, однако сами ученые не понимают, как нейросети это делают, — говорит Михаил Белкин из Калифорнийского технического университета
Белкину можно верить, он является одним из ведущих специалистов в области ИИ. Он утверждает: гарантий, что человечество сможет контролировать свое детище, вообще нет никаких. И не предвидится...
* Признана экстремистской организацией и запрещена в РФ
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас

NASA объявило: Найдены самые убедительные доказательства существования жизни на Марсе
Ученые тем временем выясняют, как могли выглядеть древние жители Красной планеты...

Специалисты предупреждают: Через три года интернет будет скорее мертвым, чем живым
Почему к 2030 году человеческое общение в сети может стать роскошью, а не нормой?...

Ученый утверждает: у него есть доказательства, что мы живем в матрице
По словам Мелвина Вопсона, подсказки он нашел в ДНК, расширении Вселенной и фундаментальных законах физики...

Найдена самая похожая на Землю планета. Готовимся к переезду?
TRAPPIST-1e идеальная: тепло, есть вода и атмосфера. Чем же тогда недовольны астрофизики?...

16-тонный саркофаг, заполненный сокровищами, может подтвердить одну из самых таинственных и кровавых легенд древнего Китая
Какой секрет хранила эта гробница, что оставалась единственной нетронутой два тысячелетия?...

Новая операция по объединению людей и животных может подарить… вечную жизнь
Медики признаются: уже сейчас можно сделать новое тело человека. Но один орган пока не поддается науке...

Археологи нашли медведя, который… побеждал гладиаторов
Исследование показало, что пленный зверь не хотел сдаваться до самого конца...

Оказывается, решение проблемы выбоин на дорогах существует уже почти 100 лет
Почему технология, забытая полвека назад, возвращается и становится очень популярной?...

Выяснилось, что полное восстановление озонового слоя закончится глобальной катастрофой
Как так вышло, что в борьбе за экологию человечество сделало себе еще хуже?...

К 2035 году сектор Газа должен стать… самым продвинутым регионом на планете под управлением ИИ
По словам экспертов, в дерзком эксперименте за 100 млрд долларов есть только один большой вопрос: Куда выселить местное население?...