Тестировщики чат-бота обнаружили его способность изощрённо лгать
OpenAI анонсировала бот ChatGPT для диалогов с искусственным интеллектом (ИИ).
Сейчас бота из серии больших языковых моделей типа GPT-3 можно бесплатно тестировать, получив учётную запись OpenAI. ChatGPT предназначен для корректных и безобидных бесед. Однако работа над ним ещё ведётся, так что заметны временные трудности, как говорится.
В отличие от модели GPT-3, используемой для игр, ChatGPT предоставляет собой более удобный диалоговый интерфейс со строгими запретами на опасные повороты беседы «не туда». То есть ChatGPT отказывается отвечать на вопросы, например, связанные с агрессией или незаконными действиями.
— Пресс-служба OpenAI.
Бот может писать стихи, исправлять ошибки в кодировании с подробными примерами, выдавать подсказки, писать новый код, излагать философскую классификацию хот-дога как вида сэндвича и так далее, и так далее.
Одна из ключевых проблем больших языковых моделей — как преодолеть человеческую агрессию. Эта трудность ограничивает их шансы на коммерческое использование. И OpenAI рассматривает ChatGPT как значительный шаг к наиболее безопасной модели ИИ.
Однако желающие уже тестировали ChatGPT, в том числе на предмет уязвимостей. И уже выяснили, как обойти некоторые встроенные фильтры ChatGPT.
Пользователь Майкл Нильсен сообщил в твиттере, что новый чат-бот OpenAI удивителен, потому что галлюцинирует очень интересными вещами. Например, поведал о книге, которой не нашлось в интернете, то есть её не существует. И даже выдал целую историю о ней!
То есть, как и GPT-3, его «кузен» способен выдумывать авторитетно звучащие вещи. Даже выдумать книгу, включая подробности о её содержании. И это пример ещё одной серьёзной проблемы с современными большими языковыми моделями.
Между тем уже пошли слухи о GPT-4. Обозреватели ждут инноваций на основе GPT, над которыми фирма работала последний год.
Сейчас бота из серии больших языковых моделей типа GPT-3 можно бесплатно тестировать, получив учётную запись OpenAI. ChatGPT предназначен для корректных и безобидных бесед. Однако работа над ним ещё ведётся, так что заметны временные трудности, как говорится.
В отличие от модели GPT-3, используемой для игр, ChatGPT предоставляет собой более удобный диалоговый интерфейс со строгими запретами на опасные повороты беседы «не туда». То есть ChatGPT отказывается отвечать на вопросы, например, связанные с агрессией или незаконными действиями.
Формат диалога позволяет ChatGPT отвечать на вопросы, признавать свои ошибки, оспаривать неправильные предпосылки и отклонять неуместные запросы
— Пресс-служба OpenAI.
Бот может писать стихи, исправлять ошибки в кодировании с подробными примерами, выдавать подсказки, писать новый код, излагать философскую классификацию хот-дога как вида сэндвича и так далее, и так далее.
Одна из ключевых проблем больших языковых моделей — как преодолеть человеческую агрессию. Эта трудность ограничивает их шансы на коммерческое использование. И OpenAI рассматривает ChatGPT как значительный шаг к наиболее безопасной модели ИИ.
Однако желающие уже тестировали ChatGPT, в том числе на предмет уязвимостей. И уже выяснили, как обойти некоторые встроенные фильтры ChatGPT.
Пользователь Майкл Нильсен сообщил в твиттере, что новый чат-бот OpenAI удивителен, потому что галлюцинирует очень интересными вещами. Например, поведал о книге, которой не нашлось в интернете, то есть её не существует. И даже выдал целую историю о ней!
То есть, как и GPT-3, его «кузен» способен выдумывать авторитетно звучащие вещи. Даже выдумать книгу, включая подробности о её содержании. И это пример ещё одной серьёзной проблемы с современными большими языковыми моделями.
Между тем уже пошли слухи о GPT-4. Обозреватели ждут инноваций на основе GPT, над которыми фирма работала последний год.
- Дмитрий Ладыгин
- arstechnica.com
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Искали золото в Австралии, а обнаружили следы взрыва тысяч атомных бомб
Почему находка древней катастрофы сильно продвинуло исследование Марса?...
5000 лет исторической тайны: кто жил на Дону до славян, рассказали археологи
95 образцов, 11 курганов, 10 стоянок полностью переписали прежнюю хронологию...
Если высохнет Каспий: почему это особенно опасно для России?
Прогнозы пугают: уникальное море-озеро может уменьшиться почти на 40%. И это катастрофа...
Третий сын Сталина: родство подтвердил уникальный документ из Красноярского архива
Будущий вождь обещал жениться, но судьба и история оказались против этого брака...
Секреты «русского гена»: о чем молчит гаплогруппа R1a1?
67 общих маркеров ДНК: половина современных русских мужчин и две трети мужчин из высших каст Северной Индии происходят от одного предка. И не только......
Почему индейцы — родственники россиян: что нашли в ДНК коренных американцев?
Как связан древний мальчик с Байкала с племенем в Амазонии? Какой подарок от древних людей помог заселить Америку?...
Гениально, многоэтажно и смертельно опасно: как римляне научились строить высотные дома
Почему реальный Древний Рим выглядел вообще не так, как нам показывают в исторических фильмах?...
Первый раз настоящий сахар нашли в космосе: почему ученые в восторге?
Чем космический сахар отличается от земного? И почему биологи говорят, что это сенсация?...
Тайный алтарь на развалинах мертвого города майя обнаружили археологи
Выяснилось, что индейцы долгие столетия продолжали исповедовать, казалось бы, давно забытый древний культ...
Непотушенный окурок взорвал целый город: чудовищная катастрофа и чудовищная ложь в США
Почему власти десятилетиями умалчивали истинную причину самого мощного техногенного ЧП в истории Штатов?...