OpenAI вот-вот проглотит огромный кусок интернета: что будет дальше и кто остановит американскую компанию?
Уверен, 9 из 10 читателей этой статьи ни разу в жизни не слышали о фирме Automattic. А вот она, скорее всего, знает про вас очень много, ведь на ее системах управления контентом (через дочернюю компанию WordPress) крутятся 43 % из 10 миллионов самых популярных сайтов в Мировой паутине. Практически половина.
Кроме того, Automattic владеет приличным списком мегаплатформ, в число которых входит и Tumblr. «Тамблер», сервис микроблогов, конечно, в последний год сильно сдал свои позиции, но 200 миллионов активных пользователей все-таки имеет. А сколько там было зарегистрировано людей за многие годы? Сказать сложно, наверное, полмиллиарда. Во всяком случае, сервис содержит невероятно огромное количество личных сообщений, за некоторые из которых стыдно до сих пор.
И вот теперь вся эта информация, в том числе и приватная, может быть передана OpenAI и Midjourney, чтобы нейросети на ней обучались. По данным сразу нескольких авторитетных интернет-ресурсов, Automattic вот-вот завершит процесс, возможно, уже на этой неделе.
Для чего это вообще нужно? Большинство людей общаются с ИИ через чат-боты. Это связано с тем, что технологические гиганты прежде всего развивают так называемые большие языковые модели.
Но алгоритмы нужно обучать и распознаванию лиц на основе наших селфи, а также улучшать генерацию изображений и видео, анализируя оригинальные картинки и ролики, которые пользователи загружают в Сеть.
Но вот как и что конкретно происходит с данными, обработанными Midjourney и OpenAI, не знает никто, даже большинство сотрудников этих компаний. По сути, это черный ящик, из которого может выскочить все что угодно.
Так что ChatGPT вполне может использовать в обучении последние слова, которые остановил перед уходом из жизни человек, или диалог, в котором люди решали производственные вопросы, связанные с коммерческой тайной.
Когда Automattic просят прокомментировать доступ ИИ к таким приватным данным, представители компании дают ссылку на страницу под названием «Защита выбора пользователя». Там в настройках конфиденциальности теперь можно включить опцию, которая «препятствует индексации сайтов поисковыми системами на WordPress.com и Tumblr».
Также есть дополнительные настройки, которые могут прямо запретить компаниям, занимающимся искусственным интеллектом, собирать данные пользователей Automattic. Кроме того, фирма обещает уведомлять партнёров, обучающих ИИ, кто из людей запретил доступ к своим данным. И тогда эти партнеры должны не только исключить контент этих пользователей из будущих обучений, но и исключить его из прошлых.
Все это замечательно, но об опциях отказа мало кто знает. Кроме того, нет никаких гарантий, что компании, развивающие нейросети, действительно будут игнорировать данные пользователей-отказников.
Но самое главное: в данный момент не существует закона, который обязывал компании, занимающиеся искусственным интеллектом, учитывать мнение пользователей в данном вопросе. По сути, сейчас конфиденциальности данных не существует, а законодательство катастрофически отстает от скорости развития новых технологий, особенно информационных.
Техногиганты типа OpenAI, Google и Meta* устроили настоящую гонку вооружений в области искусственного интеллекта. При этом обычные люди, которые производят в интернете основную часть контента, оказались в самом центре событий. Практически каждое приложение, сайт или социальная платформа требует, чтобы мы нажали «Да», тем самым полностью согласившись с их условиями. А в них, как оказалось в последнее время, стоит по умолчанию предоставление личных данных для обучения нейросетей.
Любое соглашение, которое мы подписываем в интернете, так или иначе разрешает сайту использовать данные, которые генерируем, с целью монетизации. При этом большинство пользователей вообще не читают, что там написано. Просто максимально быстро проматывают до конца.
Впрочем, многие сайты даже не сообщают своим пользователям, что они предоставляют данные OpenAI / Midjourney. Максимум могут единоразово прислать письмо на электронную почту, которое моментально затеряется в тоннах спама.
Но самое страшное вовсе не это, а то, что совершенно непонятно, чем закончится гонка искусственных интеллектов и нейросетей. Это признают даже лучшие разработчики.
Белкину можно верить, он является одним из ведущих специалистов в области ИИ. Он утверждает: гарантий, что человечество сможет контролировать свое детище, вообще нет никаких. И не предвидится...
* Признана экстремистской организацией и запрещена в РФ
Кроме того, Automattic владеет приличным списком мегаплатформ, в число которых входит и Tumblr. «Тамблер», сервис микроблогов, конечно, в последний год сильно сдал свои позиции, но 200 миллионов активных пользователей все-таки имеет. А сколько там было зарегистрировано людей за многие годы? Сказать сложно, наверное, полмиллиарда. Во всяком случае, сервис содержит невероятно огромное количество личных сообщений, за некоторые из которых стыдно до сих пор.
Приватность отменяется?
И вот теперь вся эта информация, в том числе и приватная, может быть передана OpenAI и Midjourney, чтобы нейросети на ней обучались. По данным сразу нескольких авторитетных интернет-ресурсов, Automattic вот-вот завершит процесс, возможно, уже на этой неделе.
Для чего это вообще нужно? Большинство людей общаются с ИИ через чат-боты. Это связано с тем, что технологические гиганты прежде всего развивают так называемые большие языковые модели.
Но алгоритмы нужно обучать и распознаванию лиц на основе наших селфи, а также улучшать генерацию изображений и видео, анализируя оригинальные картинки и ролики, которые пользователи загружают в Сеть.
Но вот как и что конкретно происходит с данными, обработанными Midjourney и OpenAI, не знает никто, даже большинство сотрудников этих компаний. По сути, это черный ящик, из которого может выскочить все что угодно.
Так что ChatGPT вполне может использовать в обучении последние слова, которые остановил перед уходом из жизни человек, или диалог, в котором люди решали производственные вопросы, связанные с коммерческой тайной.
Когда Automattic просят прокомментировать доступ ИИ к таким приватным данным, представители компании дают ссылку на страницу под названием «Защита выбора пользователя». Там в настройках конфиденциальности теперь можно включить опцию, которая «препятствует индексации сайтов поисковыми системами на WordPress.com и Tumblr».
Также есть дополнительные настройки, которые могут прямо запретить компаниям, занимающимся искусственным интеллектом, собирать данные пользователей Automattic. Кроме того, фирма обещает уведомлять партнёров, обучающих ИИ, кто из людей запретил доступ к своим данным. И тогда эти партнеры должны не только исключить контент этих пользователей из будущих обучений, но и исключить его из прошлых.
Закон не запрещает
Все это замечательно, но об опциях отказа мало кто знает. Кроме того, нет никаких гарантий, что компании, развивающие нейросети, действительно будут игнорировать данные пользователей-отказников.
Но самое главное: в данный момент не существует закона, который обязывал компании, занимающиеся искусственным интеллектом, учитывать мнение пользователей в данном вопросе. По сути, сейчас конфиденциальности данных не существует, а законодательство катастрофически отстает от скорости развития новых технологий, особенно информационных.
Техногиганты типа OpenAI, Google и Meta* устроили настоящую гонку вооружений в области искусственного интеллекта. При этом обычные люди, которые производят в интернете основную часть контента, оказались в самом центре событий. Практически каждое приложение, сайт или социальная платформа требует, чтобы мы нажали «Да», тем самым полностью согласившись с их условиями. А в них, как оказалось в последнее время, стоит по умолчанию предоставление личных данных для обучения нейросетей.
Любое соглашение, которое мы подписываем в интернете, так или иначе разрешает сайту использовать данные, которые генерируем, с целью монетизации. При этом большинство пользователей вообще не читают, что там написано. Просто максимально быстро проматывают до конца.
Впрочем, многие сайты даже не сообщают своим пользователям, что они предоставляют данные OpenAI / Midjourney. Максимум могут единоразово прислать письмо на электронную почту, которое моментально затеряется в тоннах спама.
А что там, в черном ящике?
Но самое страшное вовсе не это, а то, что совершенно непонятно, чем закончится гонка искусственных интеллектов и нейросетей. Это признают даже лучшие разработчики.
— Наш теоретический анализ очень далек от того, на что способны эти модели. При этом многие модели представляют собой настоящие черные ящики. Да, они выдают полезные результаты, однако сами ученые не понимают, как нейросети это делают, — говорит Михаил Белкин из Калифорнийского технического университета
Белкину можно верить, он является одним из ведущих специалистов в области ИИ. Он утверждает: гарантий, что человечество сможет контролировать свое детище, вообще нет никаких. И не предвидится...
* Признана экстремистской организацией и запрещена в РФ
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Кто убивает итальянских волков: зоологи были потрясены кадрами с автоматической камеры
Трагический эпизод показал, что некоторые зоологические теории придется кардинально пересмотреть. У серых хищников есть неожиданные враги...
Очередной миф Николая Карамзина полностью развеян российскими археологами
Оказалось, что Иван Грозный не убивал супругу своего младшего брата. Напротив, с княгиней Ульянией Углицкой случалась куда более таинственная и запутанная...
Самая запрещенная русская сказка: почему «Курочку Рябу» не любили ни цари, ни руководители СССР?
Чтобы эту историю можно было рассказывать советским детям, ее сюжет пришлось изменить самым радикальным образом. Но, может быть, это и к лучшему...
Американский «Чернобыль-80»: эта катастрофа едва не изменила всю историю США
Эксперты говорят: лишь счастливая случайность не позволила взорваться заряду в 600 (!) раз мощнее хиросимской бомбы...
80 лет без Звезды Героя: почему офицер, поставивший Знамя Победы, не получил заслуженную награду при жизни?
Только указ Президента России смог исправить одну из самых вопиющих несправедливостей в советской истории...
Гениальное ДНК-«мошенничество»: ученые раскрыли секрет рыбы, которая плевать хотела на главные законы биологии
100 000 лет успешного клонирования: амазонская моллинезия просто... копирует себя. И при этом удивительно успешно ремонтируют поврежденные гены, насмехаясь над...
Почему на Иран обрушился черный дождь и насколько он опасен?
Экологи говорят: агрессивные действия США и Израиля поставили под угрозу здоровье миллионов людей по всей планете...
Каменный топор со дна реки может переписать древнейшую историю Сибири
По словам ученых, получился отличный научный детектив: добыча золота, артефакт бронзового века, забытая цивилизация...
Главный секрет человеческого дыхания: ученые рассказали, почему мы дышим «вахтовым методом»
Эксперты предупреждают: из-за особенности организма многие люди не смогут попасть в космос. Но решение все-таки есть...
Японец 26 лет ждал, пока раскроют убийство его жены
Как новейшие технологии помогли сдвинуть с места нераскрываемое дело...
43 000 черепков открыли тысячелетние тайны Древнего Египта
Почему глиняная библиотека Атрибиса потрясла весь археологический мир?...
Японец 26 лет ждал, пока раскроют убийство его жены. Часть 2. Расплата
Как наука отменила срок давности у преступления? И какая тайна осталась не раскрытой?...