Тестировщики чат-бота обнаружили его способность изощрённо лгать
OpenAI анонсировала бот ChatGPT для диалогов с искусственным интеллектом (ИИ).
Сейчас бота из серии больших языковых моделей типа GPT-3 можно бесплатно тестировать, получив учётную запись OpenAI. ChatGPT предназначен для корректных и безобидных бесед. Однако работа над ним ещё ведётся, так что заметны временные трудности, как говорится.
В отличие от модели GPT-3, используемой для игр, ChatGPT предоставляет собой более удобный диалоговый интерфейс со строгими запретами на опасные повороты беседы «не туда». То есть ChatGPT отказывается отвечать на вопросы, например, связанные с агрессией или незаконными действиями.
— Пресс-служба OpenAI.
Бот может писать стихи, исправлять ошибки в кодировании с подробными примерами, выдавать подсказки, писать новый код, излагать философскую классификацию хот-дога как вида сэндвича и так далее, и так далее.
Одна из ключевых проблем больших языковых моделей — как преодолеть человеческую агрессию. Эта трудность ограничивает их шансы на коммерческое использование. И OpenAI рассматривает ChatGPT как значительный шаг к наиболее безопасной модели ИИ.
Однако желающие уже тестировали ChatGPT, в том числе на предмет уязвимостей. И уже выяснили, как обойти некоторые встроенные фильтры ChatGPT.
Пользователь Майкл Нильсен сообщил в твиттере, что новый чат-бот OpenAI удивителен, потому что галлюцинирует очень интересными вещами. Например, поведал о книге, которой не нашлось в интернете, то есть её не существует. И даже выдал целую историю о ней!
То есть, как и GPT-3, его «кузен» способен выдумывать авторитетно звучащие вещи. Даже выдумать книгу, включая подробности о её содержании. И это пример ещё одной серьёзной проблемы с современными большими языковыми моделями.
Между тем уже пошли слухи о GPT-4. Обозреватели ждут инноваций на основе GPT, над которыми фирма работала последний год.
Сейчас бота из серии больших языковых моделей типа GPT-3 можно бесплатно тестировать, получив учётную запись OpenAI. ChatGPT предназначен для корректных и безобидных бесед. Однако работа над ним ещё ведётся, так что заметны временные трудности, как говорится.
В отличие от модели GPT-3, используемой для игр, ChatGPT предоставляет собой более удобный диалоговый интерфейс со строгими запретами на опасные повороты беседы «не туда». То есть ChatGPT отказывается отвечать на вопросы, например, связанные с агрессией или незаконными действиями.
Формат диалога позволяет ChatGPT отвечать на вопросы, признавать свои ошибки, оспаривать неправильные предпосылки и отклонять неуместные запросы
— Пресс-служба OpenAI.
Бот может писать стихи, исправлять ошибки в кодировании с подробными примерами, выдавать подсказки, писать новый код, излагать философскую классификацию хот-дога как вида сэндвича и так далее, и так далее.
Одна из ключевых проблем больших языковых моделей — как преодолеть человеческую агрессию. Эта трудность ограничивает их шансы на коммерческое использование. И OpenAI рассматривает ChatGPT как значительный шаг к наиболее безопасной модели ИИ.
Однако желающие уже тестировали ChatGPT, в том числе на предмет уязвимостей. И уже выяснили, как обойти некоторые встроенные фильтры ChatGPT.
Пользователь Майкл Нильсен сообщил в твиттере, что новый чат-бот OpenAI удивителен, потому что галлюцинирует очень интересными вещами. Например, поведал о книге, которой не нашлось в интернете, то есть её не существует. И даже выдал целую историю о ней!
То есть, как и GPT-3, его «кузен» способен выдумывать авторитетно звучащие вещи. Даже выдумать книгу, включая подробности о её содержании. И это пример ещё одной серьёзной проблемы с современными большими языковыми моделями.
Между тем уже пошли слухи о GPT-4. Обозреватели ждут инноваций на основе GPT, над которыми фирма работала последний год.
- Дмитрий Ладыгин
- arstechnica.com
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Новое исследование показало: Стоунхендж столетиями «водил за нос». Похоже, историю опять придется переписывать
Оказалось, что сенсация скрывалась в огромном круге, состоящем из загадочных шахт...
Людовик XIV умер совсем не от гангрены: ученые сумели раскрыть истину лишь 310 лет спустя
Эксперты говорят: французский король был обречен. Медикам того времени была совершенно неизвестна его болезнь...
Необъяснимые аномалии в тайге на Дальнем Востоке: читаем походные дневники военного разведчика и писателя Владимира Арсеньева
Часть первая: свет в ночном море, мираж «фата-моргана» и почти моментальное замерзание воды...
ЦРУ, море в пустыне и нефть: кто и зачем остановил проект Египта на 60 лет?
Часть вторая: Холодная война, 200 ядерных взрывов и 15 миллиардов, которые могут все изменить...
Меньше трех дней до конца света на орбите: почему программа CRASH Clock бьет тревогу?
Сотрудники Маска уверяют, что у них все под контролем. Но эксперты сравнивают орбиту с карточным домиком. Кто же прав?...
Что стоит за таинственными аномалиями в дальневосточной тайге? Продолжаем читать походные дневники военного разведчика и писателя Владимира Арсеньева
Часть вторая: снежная гроза, феномен моретрясения и встреча со «снежным человеком»...
Египет хотел создать МОРЕ в пустыне Сахара: почему проект заморозили на 60 лет?
Часть первая: Реальный шанс спастись от всемирного потопа...
Российский ученый уверен, что максимально приблизился к разгадке тайны шаровой молнии
Похоже, наука ошибалась: это не плазменный сгусток, а «живой кристалл» из частиц-призраков...
Темная сторона Рима: выяснилось, что Империя веками «выкачивала» здоровье из покоренных народов
Новые находки заставили ученых признать: для простых людей римский «прогресс» был скорее приговором, чем спасением. Но почему же так вышло?...
Загадочная письменность Б из пещер у Мертвого моря наконец-то расшифрована
Ученые «ломали» древний шифр эпохи Христа более 70 лет, но результат разочаровал многих. Почему?...
Встречи с неведомым: завершаем чтение дневников разведчика и писателя Владимира Арсеньева
Часть третья: таинственный огонь в лесу, свет из облаков, призрак в тумане и странный дым на море...
Парадокс Великой Зеленой стены: Китай посадил 78 миллиардов новых деревьев, но климат стал только хуже. Как так вышло?
Ученые назвали причины, почему самый грандиозный экологический проект за всю историю в итоге обернулся головной болью для миллионов китайских граждан...
Первая «чернокожая британка» оказалась белой: новое исследование заставило историков полностью пересмотреть портрет женщины из Бичи-Хед
Почему ученые так сильно ошиблись с ее внешностью? И стоит ли после этого доверять реконструкциям по ДНК?...