OpenAI вот-вот проглотит огромный кусок интернета: что будет дальше и кто остановит американскую компанию?
Уверен, 9 из 10 читателей этой статьи ни разу в жизни не слышали о фирме Automattic. А вот она, скорее всего, знает про вас очень много, ведь на ее системах управления контентом (через дочернюю компанию WordPress) крутятся 43 % из 10 миллионов самых популярных сайтов в Мировой паутине. Практически половина.
Кроме того, Automattic владеет приличным списком мегаплатформ, в число которых входит и Tumblr. «Тамблер», сервис микроблогов, конечно, в последний год сильно сдал свои позиции, но 200 миллионов активных пользователей все-таки имеет. А сколько там было зарегистрировано людей за многие годы? Сказать сложно, наверное, полмиллиарда. Во всяком случае, сервис содержит невероятно огромное количество личных сообщений, за некоторые из которых стыдно до сих пор.
И вот теперь вся эта информация, в том числе и приватная, может быть передана OpenAI и Midjourney, чтобы нейросети на ней обучались. По данным сразу нескольких авторитетных интернет-ресурсов, Automattic вот-вот завершит процесс, возможно, уже на этой неделе.
Для чего это вообще нужно? Большинство людей общаются с ИИ через чат-боты. Это связано с тем, что технологические гиганты прежде всего развивают так называемые большие языковые модели.
Но алгоритмы нужно обучать и распознаванию лиц на основе наших селфи, а также улучшать генерацию изображений и видео, анализируя оригинальные картинки и ролики, которые пользователи загружают в Сеть.
Но вот как и что конкретно происходит с данными, обработанными Midjourney и OpenAI, не знает никто, даже большинство сотрудников этих компаний. По сути, это черный ящик, из которого может выскочить все что угодно.
Так что ChatGPT вполне может использовать в обучении последние слова, которые остановил перед уходом из жизни человек, или диалог, в котором люди решали производственные вопросы, связанные с коммерческой тайной.
Когда Automattic просят прокомментировать доступ ИИ к таким приватным данным, представители компании дают ссылку на страницу под названием «Защита выбора пользователя». Там в настройках конфиденциальности теперь можно включить опцию, которая «препятствует индексации сайтов поисковыми системами на WordPress.com и Tumblr».
Также есть дополнительные настройки, которые могут прямо запретить компаниям, занимающимся искусственным интеллектом, собирать данные пользователей Automattic. Кроме того, фирма обещает уведомлять партнёров, обучающих ИИ, кто из людей запретил доступ к своим данным. И тогда эти партнеры должны не только исключить контент этих пользователей из будущих обучений, но и исключить его из прошлых.
Все это замечательно, но об опциях отказа мало кто знает. Кроме того, нет никаких гарантий, что компании, развивающие нейросети, действительно будут игнорировать данные пользователей-отказников.
Но самое главное: в данный момент не существует закона, который обязывал компании, занимающиеся искусственным интеллектом, учитывать мнение пользователей в данном вопросе. По сути, сейчас конфиденциальности данных не существует, а законодательство катастрофически отстает от скорости развития новых технологий, особенно информационных.
Техногиганты типа OpenAI, Google и Meta* устроили настоящую гонку вооружений в области искусственного интеллекта. При этом обычные люди, которые производят в интернете основную часть контента, оказались в самом центре событий. Практически каждое приложение, сайт или социальная платформа требует, чтобы мы нажали «Да», тем самым полностью согласившись с их условиями. А в них, как оказалось в последнее время, стоит по умолчанию предоставление личных данных для обучения нейросетей.
Любое соглашение, которое мы подписываем в интернете, так или иначе разрешает сайту использовать данные, которые генерируем, с целью монетизации. При этом большинство пользователей вообще не читают, что там написано. Просто максимально быстро проматывают до конца.
Впрочем, многие сайты даже не сообщают своим пользователям, что они предоставляют данные OpenAI / Midjourney. Максимум могут единоразово прислать письмо на электронную почту, которое моментально затеряется в тоннах спама.
Но самое страшное вовсе не это, а то, что совершенно непонятно, чем закончится гонка искусственных интеллектов и нейросетей. Это признают даже лучшие разработчики.
Белкину можно верить, он является одним из ведущих специалистов в области ИИ. Он утверждает: гарантий, что человечество сможет контролировать свое детище, вообще нет никаких. И не предвидится...
* Признана экстремистской организацией и запрещена в РФ
Кроме того, Automattic владеет приличным списком мегаплатформ, в число которых входит и Tumblr. «Тамблер», сервис микроблогов, конечно, в последний год сильно сдал свои позиции, но 200 миллионов активных пользователей все-таки имеет. А сколько там было зарегистрировано людей за многие годы? Сказать сложно, наверное, полмиллиарда. Во всяком случае, сервис содержит невероятно огромное количество личных сообщений, за некоторые из которых стыдно до сих пор.
Приватность отменяется?
И вот теперь вся эта информация, в том числе и приватная, может быть передана OpenAI и Midjourney, чтобы нейросети на ней обучались. По данным сразу нескольких авторитетных интернет-ресурсов, Automattic вот-вот завершит процесс, возможно, уже на этой неделе.
Для чего это вообще нужно? Большинство людей общаются с ИИ через чат-боты. Это связано с тем, что технологические гиганты прежде всего развивают так называемые большие языковые модели.
Но алгоритмы нужно обучать и распознаванию лиц на основе наших селфи, а также улучшать генерацию изображений и видео, анализируя оригинальные картинки и ролики, которые пользователи загружают в Сеть.
Но вот как и что конкретно происходит с данными, обработанными Midjourney и OpenAI, не знает никто, даже большинство сотрудников этих компаний. По сути, это черный ящик, из которого может выскочить все что угодно.
Так что ChatGPT вполне может использовать в обучении последние слова, которые остановил перед уходом из жизни человек, или диалог, в котором люди решали производственные вопросы, связанные с коммерческой тайной.
Когда Automattic просят прокомментировать доступ ИИ к таким приватным данным, представители компании дают ссылку на страницу под названием «Защита выбора пользователя». Там в настройках конфиденциальности теперь можно включить опцию, которая «препятствует индексации сайтов поисковыми системами на WordPress.com и Tumblr».
Также есть дополнительные настройки, которые могут прямо запретить компаниям, занимающимся искусственным интеллектом, собирать данные пользователей Automattic. Кроме того, фирма обещает уведомлять партнёров, обучающих ИИ, кто из людей запретил доступ к своим данным. И тогда эти партнеры должны не только исключить контент этих пользователей из будущих обучений, но и исключить его из прошлых.
Закон не запрещает
Все это замечательно, но об опциях отказа мало кто знает. Кроме того, нет никаких гарантий, что компании, развивающие нейросети, действительно будут игнорировать данные пользователей-отказников.
Но самое главное: в данный момент не существует закона, который обязывал компании, занимающиеся искусственным интеллектом, учитывать мнение пользователей в данном вопросе. По сути, сейчас конфиденциальности данных не существует, а законодательство катастрофически отстает от скорости развития новых технологий, особенно информационных.
Техногиганты типа OpenAI, Google и Meta* устроили настоящую гонку вооружений в области искусственного интеллекта. При этом обычные люди, которые производят в интернете основную часть контента, оказались в самом центре событий. Практически каждое приложение, сайт или социальная платформа требует, чтобы мы нажали «Да», тем самым полностью согласившись с их условиями. А в них, как оказалось в последнее время, стоит по умолчанию предоставление личных данных для обучения нейросетей.
Любое соглашение, которое мы подписываем в интернете, так или иначе разрешает сайту использовать данные, которые генерируем, с целью монетизации. При этом большинство пользователей вообще не читают, что там написано. Просто максимально быстро проматывают до конца.
Впрочем, многие сайты даже не сообщают своим пользователям, что они предоставляют данные OpenAI / Midjourney. Максимум могут единоразово прислать письмо на электронную почту, которое моментально затеряется в тоннах спама.
А что там, в черном ящике?
Но самое страшное вовсе не это, а то, что совершенно непонятно, чем закончится гонка искусственных интеллектов и нейросетей. Это признают даже лучшие разработчики.
— Наш теоретический анализ очень далек от того, на что способны эти модели. При этом многие модели представляют собой настоящие черные ящики. Да, они выдают полезные результаты, однако сами ученые не понимают, как нейросети это делают, — говорит Михаил Белкин из Калифорнийского технического университета
Белкину можно верить, он является одним из ведущих специалистов в области ИИ. Он утверждает: гарантий, что человечество сможет контролировать свое детище, вообще нет никаких. И не предвидится...
* Признана экстремистской организацией и запрещена в РФ
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Он был размером как четыре Эвереста
Ученые считают: жизнь на Земле породил гигантский метеорит....
Швейцарские ученые собираются распылить в атмосфере миллионы тонн алмазов
Остановит ли это глобальное потепление?...
Секретные китайские спутники «Тысячи парусов» — новый кошмар для астрономов
Наблюдать за звездами с Земли становится всё проблематичнее....
Раскрыта правда о «зелёной» Англии
На самом деле, Великобритании угрожает лососевое вымирание....
Почему викинги не сумели колонизировать Северную Америку?
1000-летняя тайна, похоже, все-таки разгадана....
Аномальное древнее кладбище найдено на юге Испании
В 5500-летнем некрополе оказалось много женщин и мало мужчин....
Лазеры раскрыли тайны затерянных городов на Великом шелковом пути
Стало известно, как города-близнецы процветали в суровом высокогорье....
Электрические обои согреют комнату за три минуты
Альтернатива центральному отоплению или очередной фейк?...
Специалисты NASA заявляют, что жизнь на Марсе может... скрываться
И они знают, где ее искать....
И снова наглый плагиат от компании Tesla?
Маск опять в суде. Теперь из-за «Бегущего по лезвию 2049»....
Ученые наконец-то подтвердили, что солнечный максимум уже наступил
Метеозависимым людям придётся несладко....
Доказано на макаках: одиночество в старости сокращает шансы заболеть
Меньше других рядом — меньше угроз....
Добыча криптовалюты: кто-то на этом зарабатывает, а кто-то теряет здоровье
Американские ученые вскрыли неожиданную проблему....
Марк Цукерберг представил «самые передовые очки за всю историю»
Разбираемся: стоит ли девайс свои 10 000 $....
Почти что полёт: найдены следы динозавра, который ускорял свой бег крыльями
Окаменевшие отпечатки позволили рассчитать особенности передвижения....
С помощью лидаров археологи нашли ещё более 6600 сооружений майя
Ещё предстоит обнаружить все крупные города древней цивилизации....