вслух.net

Тестировщики чат-бота обнаружили его способность изощрённо лгать

Тестировщики чат-бота обнаружили его способность изощрённо лгать
OpenAI анонсировала бот ChatGPT для диалогов с искусственным интеллектом (ИИ).


Сейчас бота из серии больших языковых моделей типа GPT-3 можно бесплатно тестировать, получив учётную запись OpenAI. ChatGPT предназначен для корректных и безобидных бесед. Однако работа над ним ещё ведётся, так что заметны временные трудности, как говорится.

В отличие от модели GPT-3, используемой для игр, ChatGPT предоставляет собой более удобный диалоговый интерфейс со строгими запретами на опасные повороты беседы «не туда». То есть ChatGPT отказывается отвечать на вопросы, например, связанные с агрессией или незаконными действиями.

Формат диалога позволяет ChatGPT отвечать на вопросы, признавать свои ошибки, оспаривать неправильные предпосылки и отклонять неуместные запросы

— Пресс-служба OpenAI.

Бот может писать стихи, исправлять ошибки в кодировании с подробными примерами, выдавать подсказки, писать новый код, излагать философскую классификацию хот-дога как вида сэндвича и так далее, и так далее.

Одна из ключевых проблем больших языковых моделей — как преодолеть человеческую агрессию. Эта трудность ограничивает их шансы на коммерческое использование. И OpenAI рассматривает ChatGPT как значительный шаг к наиболее безопасной модели ИИ.

Однако желающие уже тестировали ChatGPT, в том числе на предмет уязвимостей. И уже выяснили, как обойти некоторые встроенные фильтры ChatGPT.

Пользователь Майкл Нильсен сообщил в твиттере, что новый чат-бот OpenAI удивителен, потому что галлюцинирует очень интересными вещами. Например, поведал о книге, которой не нашлось в интернете, то есть её не существует. И даже выдал целую историю о ней!

То есть, как и GPT-3, его «кузен» способен выдумывать авторитетно звучащие вещи. Даже выдумать книгу, включая подробности о её содержании. И это пример ещё одной серьёзной проблемы с современными большими языковыми моделями.

Между тем уже пошли слухи о GPT-4. Обозреватели ждут инноваций на основе GPT, над которыми фирма работала последний год.

Автор:

Использованы фотографии: arstechnica.com

Мы в Мы в Яндекс Дзен
Пять лучших бесплатных альтернатив Adobe PDF ReaderOnyx Boox Nova Air 2 E-Note — недопланшет, или читалка на стероидах? Обзор