Тестировщики чат-бота обнаружили его способность изощрённо лгать
OpenAI анонсировала бот ChatGPT для диалогов с искусственным интеллектом (ИИ).
Сейчас бота из серии больших языковых моделей типа GPT-3 можно бесплатно тестировать, получив учётную запись OpenAI. ChatGPT предназначен для корректных и безобидных бесед. Однако работа над ним ещё ведётся, так что заметны временные трудности, как говорится.
В отличие от модели GPT-3, используемой для игр, ChatGPT предоставляет собой более удобный диалоговый интерфейс со строгими запретами на опасные повороты беседы «не туда». То есть ChatGPT отказывается отвечать на вопросы, например, связанные с агрессией или незаконными действиями.
— Пресс-служба OpenAI.
Бот может писать стихи, исправлять ошибки в кодировании с подробными примерами, выдавать подсказки, писать новый код, излагать философскую классификацию хот-дога как вида сэндвича и так далее, и так далее.
Одна из ключевых проблем больших языковых моделей — как преодолеть человеческую агрессию. Эта трудность ограничивает их шансы на коммерческое использование. И OpenAI рассматривает ChatGPT как значительный шаг к наиболее безопасной модели ИИ.
Однако желающие уже тестировали ChatGPT, в том числе на предмет уязвимостей. И уже выяснили, как обойти некоторые встроенные фильтры ChatGPT.
Пользователь Майкл Нильсен сообщил в твиттере, что новый чат-бот OpenAI удивителен, потому что галлюцинирует очень интересными вещами. Например, поведал о книге, которой не нашлось в интернете, то есть её не существует. И даже выдал целую историю о ней!
То есть, как и GPT-3, его «кузен» способен выдумывать авторитетно звучащие вещи. Даже выдумать книгу, включая подробности о её содержании. И это пример ещё одной серьёзной проблемы с современными большими языковыми моделями.
Между тем уже пошли слухи о GPT-4. Обозреватели ждут инноваций на основе GPT, над которыми фирма работала последний год.
Сейчас бота из серии больших языковых моделей типа GPT-3 можно бесплатно тестировать, получив учётную запись OpenAI. ChatGPT предназначен для корректных и безобидных бесед. Однако работа над ним ещё ведётся, так что заметны временные трудности, как говорится.
В отличие от модели GPT-3, используемой для игр, ChatGPT предоставляет собой более удобный диалоговый интерфейс со строгими запретами на опасные повороты беседы «не туда». То есть ChatGPT отказывается отвечать на вопросы, например, связанные с агрессией или незаконными действиями.
Формат диалога позволяет ChatGPT отвечать на вопросы, признавать свои ошибки, оспаривать неправильные предпосылки и отклонять неуместные запросы
— Пресс-служба OpenAI.
Бот может писать стихи, исправлять ошибки в кодировании с подробными примерами, выдавать подсказки, писать новый код, излагать философскую классификацию хот-дога как вида сэндвича и так далее, и так далее.
Одна из ключевых проблем больших языковых моделей — как преодолеть человеческую агрессию. Эта трудность ограничивает их шансы на коммерческое использование. И OpenAI рассматривает ChatGPT как значительный шаг к наиболее безопасной модели ИИ.
Однако желающие уже тестировали ChatGPT, в том числе на предмет уязвимостей. И уже выяснили, как обойти некоторые встроенные фильтры ChatGPT.
Пользователь Майкл Нильсен сообщил в твиттере, что новый чат-бот OpenAI удивителен, потому что галлюцинирует очень интересными вещами. Например, поведал о книге, которой не нашлось в интернете, то есть её не существует. И даже выдал целую историю о ней!
То есть, как и GPT-3, его «кузен» способен выдумывать авторитетно звучащие вещи. Даже выдумать книгу, включая подробности о её содержании. И это пример ещё одной серьёзной проблемы с современными большими языковыми моделями.
Между тем уже пошли слухи о GPT-4. Обозреватели ждут инноваций на основе GPT, над которыми фирма работала последний год.
- Дмитрий Ладыгин
- arstechnica.com
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Очередной миф Николая Карамзина полностью развеян российскими археологами
Оказалось, что Иван Грозный не убивал супругу своего младшего брата. Напротив, с княгиней Ульянией Углицкой случалась куда более таинственная и запутанная...
Самая запрещенная русская сказка: почему «Курочку Рябу» не любили ни цари, ни руководители СССР?
Чтобы эту историю можно было рассказывать советским детям, ее сюжет пришлось изменить самым радикальным образом. Но, может быть, это и к лучшему...
Американский «Чернобыль-80»: эта катастрофа едва не изменила всю историю США
Эксперты говорят: лишь счастливая случайность не позволила взорваться заряду в 600 (!) раз мощнее хиросимской бомбы...
Японец 26 лет ждал, пока раскроют убийство его жены. Часть 2. Расплата
Как наука отменила срок давности у преступления? И какая тайна осталась не раскрытой?...
Тайна гибели сибирского «Титаника»: почему некоторые детали катастрофы 1921 года неизвестны даже сейчас?
Поразительно, но тогда судьи единогласно оправдали капитана парохода. Так кто же тогда был виновником этого страшного происшествия?...
Гениальное ДНК-«мошенничество»: ученые раскрыли секрет рыбы, которая плевать хотела на главные законы биологии
100 000 лет успешного клонирования: амазонская моллинезия просто... копирует себя. И при этом удивительно успешно ремонтируют поврежденные гены, насмехаясь над...
Почему на Иран обрушился черный дождь и насколько он опасен?
Экологи говорят: агрессивные действия США и Израиля поставили под угрозу здоровье миллионов людей по всей планете...
Японец 26 лет ждал, пока раскроют убийство его жены
Как новейшие технологии помогли сдвинуть с места нераскрываемое дело...
Каменный топор со дна реки может переписать древнейшую историю Сибири
По словам ученых, получился отличный научный детектив: добыча золота, артефакт бронзового века, забытая цивилизация...
Главный секрет человеческого дыхания: ученые рассказали, почему мы дышим «вахтовым методом»
Эксперты предупреждают: из-за особенности организма многие люди не смогут попасть в космос. Но решение все-таки есть...
43 000 черепков открыли тысячелетние тайны Древнего Египта
Почему глиняная библиотека Атрибиса потрясла весь археологический мир?...
Раскрыта главная тайна антарктического льда: ученые узнали, как и кем была взломана природная защита Шестого континента
Похоже, той Антарктиде, которую мы знаем, приходит конец. Впрочем, это не точно...