OpenAI вот-вот проглотит огромный кусок интернета: что будет дальше и кто остановит американскую компанию?
Уверен, 9 из 10 читателей этой статьи ни разу в жизни не слышали о фирме Automattic. А вот она, скорее всего, знает про вас очень много, ведь на ее системах управления контентом (через дочернюю компанию WordPress) крутятся 43 % из 10 миллионов самых популярных сайтов в Мировой паутине. Практически половина.
Кроме того, Automattic владеет приличным списком мегаплатформ, в число которых входит и Tumblr. «Тамблер», сервис микроблогов, конечно, в последний год сильно сдал свои позиции, но 200 миллионов активных пользователей все-таки имеет. А сколько там было зарегистрировано людей за многие годы? Сказать сложно, наверное, полмиллиарда. Во всяком случае, сервис содержит невероятно огромное количество личных сообщений, за некоторые из которых стыдно до сих пор.
И вот теперь вся эта информация, в том числе и приватная, может быть передана OpenAI и Midjourney, чтобы нейросети на ней обучались. По данным сразу нескольких авторитетных интернет-ресурсов, Automattic вот-вот завершит процесс, возможно, уже на этой неделе.
Для чего это вообще нужно? Большинство людей общаются с ИИ через чат-боты. Это связано с тем, что технологические гиганты прежде всего развивают так называемые большие языковые модели.
Но алгоритмы нужно обучать и распознаванию лиц на основе наших селфи, а также улучшать генерацию изображений и видео, анализируя оригинальные картинки и ролики, которые пользователи загружают в Сеть.
Но вот как и что конкретно происходит с данными, обработанными Midjourney и OpenAI, не знает никто, даже большинство сотрудников этих компаний. По сути, это черный ящик, из которого может выскочить все что угодно.
Так что ChatGPT вполне может использовать в обучении последние слова, которые остановил перед уходом из жизни человек, или диалог, в котором люди решали производственные вопросы, связанные с коммерческой тайной.
Когда Automattic просят прокомментировать доступ ИИ к таким приватным данным, представители компании дают ссылку на страницу под названием «Защита выбора пользователя». Там в настройках конфиденциальности теперь можно включить опцию, которая «препятствует индексации сайтов поисковыми системами на WordPress.com и Tumblr».
Также есть дополнительные настройки, которые могут прямо запретить компаниям, занимающимся искусственным интеллектом, собирать данные пользователей Automattic. Кроме того, фирма обещает уведомлять партнёров, обучающих ИИ, кто из людей запретил доступ к своим данным. И тогда эти партнеры должны не только исключить контент этих пользователей из будущих обучений, но и исключить его из прошлых.
Все это замечательно, но об опциях отказа мало кто знает. Кроме того, нет никаких гарантий, что компании, развивающие нейросети, действительно будут игнорировать данные пользователей-отказников.
Но самое главное: в данный момент не существует закона, который обязывал компании, занимающиеся искусственным интеллектом, учитывать мнение пользователей в данном вопросе. По сути, сейчас конфиденциальности данных не существует, а законодательство катастрофически отстает от скорости развития новых технологий, особенно информационных.
Техногиганты типа OpenAI, Google и Meta* устроили настоящую гонку вооружений в области искусственного интеллекта. При этом обычные люди, которые производят в интернете основную часть контента, оказались в самом центре событий. Практически каждое приложение, сайт или социальная платформа требует, чтобы мы нажали «Да», тем самым полностью согласившись с их условиями. А в них, как оказалось в последнее время, стоит по умолчанию предоставление личных данных для обучения нейросетей.
Любое соглашение, которое мы подписываем в интернете, так или иначе разрешает сайту использовать данные, которые генерируем, с целью монетизации. При этом большинство пользователей вообще не читают, что там написано. Просто максимально быстро проматывают до конца.
Впрочем, многие сайты даже не сообщают своим пользователям, что они предоставляют данные OpenAI / Midjourney. Максимум могут единоразово прислать письмо на электронную почту, которое моментально затеряется в тоннах спама.
Но самое страшное вовсе не это, а то, что совершенно непонятно, чем закончится гонка искусственных интеллектов и нейросетей. Это признают даже лучшие разработчики.
Белкину можно верить, он является одним из ведущих специалистов в области ИИ. Он утверждает: гарантий, что человечество сможет контролировать свое детище, вообще нет никаких. И не предвидится...
* Признана экстремистской организацией и запрещена в РФ
Кроме того, Automattic владеет приличным списком мегаплатформ, в число которых входит и Tumblr. «Тамблер», сервис микроблогов, конечно, в последний год сильно сдал свои позиции, но 200 миллионов активных пользователей все-таки имеет. А сколько там было зарегистрировано людей за многие годы? Сказать сложно, наверное, полмиллиарда. Во всяком случае, сервис содержит невероятно огромное количество личных сообщений, за некоторые из которых стыдно до сих пор.
Приватность отменяется?
И вот теперь вся эта информация, в том числе и приватная, может быть передана OpenAI и Midjourney, чтобы нейросети на ней обучались. По данным сразу нескольких авторитетных интернет-ресурсов, Automattic вот-вот завершит процесс, возможно, уже на этой неделе.
Для чего это вообще нужно? Большинство людей общаются с ИИ через чат-боты. Это связано с тем, что технологические гиганты прежде всего развивают так называемые большие языковые модели.
Но алгоритмы нужно обучать и распознаванию лиц на основе наших селфи, а также улучшать генерацию изображений и видео, анализируя оригинальные картинки и ролики, которые пользователи загружают в Сеть.
Но вот как и что конкретно происходит с данными, обработанными Midjourney и OpenAI, не знает никто, даже большинство сотрудников этих компаний. По сути, это черный ящик, из которого может выскочить все что угодно.
Так что ChatGPT вполне может использовать в обучении последние слова, которые остановил перед уходом из жизни человек, или диалог, в котором люди решали производственные вопросы, связанные с коммерческой тайной.
Когда Automattic просят прокомментировать доступ ИИ к таким приватным данным, представители компании дают ссылку на страницу под названием «Защита выбора пользователя». Там в настройках конфиденциальности теперь можно включить опцию, которая «препятствует индексации сайтов поисковыми системами на WordPress.com и Tumblr».
Также есть дополнительные настройки, которые могут прямо запретить компаниям, занимающимся искусственным интеллектом, собирать данные пользователей Automattic. Кроме того, фирма обещает уведомлять партнёров, обучающих ИИ, кто из людей запретил доступ к своим данным. И тогда эти партнеры должны не только исключить контент этих пользователей из будущих обучений, но и исключить его из прошлых.
Закон не запрещает
Все это замечательно, но об опциях отказа мало кто знает. Кроме того, нет никаких гарантий, что компании, развивающие нейросети, действительно будут игнорировать данные пользователей-отказников.
Но самое главное: в данный момент не существует закона, который обязывал компании, занимающиеся искусственным интеллектом, учитывать мнение пользователей в данном вопросе. По сути, сейчас конфиденциальности данных не существует, а законодательство катастрофически отстает от скорости развития новых технологий, особенно информационных.
Техногиганты типа OpenAI, Google и Meta* устроили настоящую гонку вооружений в области искусственного интеллекта. При этом обычные люди, которые производят в интернете основную часть контента, оказались в самом центре событий. Практически каждое приложение, сайт или социальная платформа требует, чтобы мы нажали «Да», тем самым полностью согласившись с их условиями. А в них, как оказалось в последнее время, стоит по умолчанию предоставление личных данных для обучения нейросетей.
Любое соглашение, которое мы подписываем в интернете, так или иначе разрешает сайту использовать данные, которые генерируем, с целью монетизации. При этом большинство пользователей вообще не читают, что там написано. Просто максимально быстро проматывают до конца.
Впрочем, многие сайты даже не сообщают своим пользователям, что они предоставляют данные OpenAI / Midjourney. Максимум могут единоразово прислать письмо на электронную почту, которое моментально затеряется в тоннах спама.
А что там, в черном ящике?
Но самое страшное вовсе не это, а то, что совершенно непонятно, чем закончится гонка искусственных интеллектов и нейросетей. Это признают даже лучшие разработчики.
— Наш теоретический анализ очень далек от того, на что способны эти модели. При этом многие модели представляют собой настоящие черные ящики. Да, они выдают полезные результаты, однако сами ученые не понимают, как нейросети это делают, — говорит Михаил Белкин из Калифорнийского технического университета
Белкину можно верить, он является одним из ведущих специалистов в области ИИ. Он утверждает: гарантий, что человечество сможет контролировать свое детище, вообще нет никаких. И не предвидится...
* Признана экстремистской организацией и запрещена в РФ
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Новое исследование показало: Стоунхендж столетиями «водил за нос». Похоже, историю опять придется переписывать
Оказалось, что сенсация скрывалась в огромном круге, состоящем из загадочных шахт...
Роковая ошибка древних врачей: Почему современные ученые считают, что Александра Македонского похоронили заживо?
Он слышал плач своих полководцев и видел приготовления к бальзамированию, но не мог пошевелиться. Тело великого царя стало его собственным гробом...
Людовик XIV умер совсем не от гангрены: ученые сумели раскрыть истину лишь 310 лет спустя
Эксперты говорят: французский король был обречен. Медикам того времени была совершенно неизвестна его болезнь...
Необъяснимые аномалии в тайге на Дальнем Востоке: читаем походные дневники военного разведчика и писателя Владимира Арсеньева
Часть первая: свет в ночном море, мираж «фата-моргана» и почти моментальное замерзание воды...
Он все слышал, но не мог пошевелиться: Жуткая правда о том, почему тело Александра Македонского не разлагалось
Великий царь стал заложником собственной плоти. Диагноз, который поставили спустя 2300 лет, объясняет все: и «чудо» нетленности, и страшную смерть....
ЦРУ, море в пустыне и нефть: кто и зачем остановил проект Египта на 60 лет?
Часть вторая: Холодная война, 200 ядерных взрывов и 15 миллиардов, которые могут все изменить...
Египет хотел создать МОРЕ в пустыне Сахара: почему проект заморозили на 60 лет?
Часть первая: Реальный шанс спастись от всемирного потопа...
Что стоит за таинственными аномалиями в дальневосточной тайге? Продолжаем читать походные дневники военного разведчика и писателя Владимира Арсеньева
Часть вторая: снежная гроза, феномен моретрясения и встреча со «снежным человеком»...
Российский ученый уверен, что максимально приблизился к разгадке тайны шаровой молнии
Похоже, наука ошибалась: это не плазменный сгусток, а «живой кристалл» из частиц-призраков...
Меньше трех дней до конца света на орбите: почему программа CRASH Clock бьет тревогу?
Сотрудники Маска уверяют, что у них все под контролем. Но эксперты сравнивают орбиту с карточным домиком. Кто же прав?...
Загадочная письменность Б из пещер у Мертвого моря наконец-то расшифрована
Ученые «ломали» древний шифр эпохи Христа более 70 лет, но результат разочаровал многих. Почему?...
Алкогольная цивилизация: древние люди освоили земледелие... ради пива
Ученые давно подозревали это, а новые находки только подлили масла в огонь «пивной» версии...
Встречи с неведомым: завершаем чтение дневников разведчика и писателя Владимира Арсеньева
Часть третья: таинственный огонь в лесу, свет из облаков, призрак в тумане и странный дым на море...