3 дек 2022 326

Тестировщики чат-бота обнаружили его способность изощрённо лгать

OpenAI анонсировала бот ChatGPT для диалогов с искусственным интеллектом (ИИ).

Сейчас бота из серии больших языковых моделей типа GPT-3 можно бесплатно тестировать, получив учётную запись OpenAI. ChatGPT предназначен для корректных и безобидных бесед. Однако работа над ним ещё ведётся, так что заметны временные трудности, как говорится.

В отличие от модели GPT-3, используемой для игр, ChatGPT предоставляет собой более удобный диалоговый интерфейс со строгими запретами на опасные повороты беседы «не туда». То есть ChatGPT отказывается отвечать на вопросы, например, связанные с агрессией или незаконными действиями.

Формат диалога позволяет ChatGPT отвечать на вопросы, признавать свои ошибки, оспаривать неправильные предпосылки и отклонять неуместные запросы

— Пресс-служба OpenAI.

Бот может писать стихи, исправлять ошибки в кодировании с подробными примерами, выдавать подсказки, писать новый код, излагать философскую классификацию хот-дога как вида сэндвича и так далее, и так далее.

Одна из ключевых проблем больших языковых моделей — как преодолеть человеческую агрессию. Эта трудность ограничивает их шансы на коммерческое использование. И OpenAI рассматривает ChatGPT как значительный шаг к наиболее безопасной модели ИИ.

Однако желающие уже тестировали ChatGPT, в том числе на предмет уязвимостей. И уже выяснили, как обойти некоторые встроенные фильтры ChatGPT.

Пользователь Майкл Нильсен сообщил в твиттере, что новый чат-бот OpenAI удивителен, потому что галлюцинирует очень интересными вещами. Например, поведал о книге, которой не нашлось в интернете, то есть её не существует. И даже выдал целую историю о ней!

То есть, как и GPT-3, его «кузен» способен выдумывать авторитетно звучащие вещи. Даже выдумать книгу, включая подробности о её содержании. И это пример ещё одной серьёзной проблемы с современными большими языковыми моделями.

Между тем уже пошли слухи о GPT-4. Обозреватели ждут инноваций на основе GPT, над которыми фирма работала последний год.

Дмитрий Ладыгин
arstechnica.com

Наши новостные каналы

Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.

ВКонтакте Дзен Одноклассники

Новое исследование показало: Стоунхендж столетиями «водил за нос». Похоже, историю опять придется переписывать

Оказалось, что сенсация скрывалась в огромном круге, состоящем из загадочных шахт...

13 дек 2025 10 436

Людовик XIV умер совсем не от гангрены: ученые сумели раскрыть истину лишь 310 лет спустя

Эксперты говорят: французский король был обречен. Медикам того времени была совершенно неизвестна его болезнь...

14 дек 2025 8 320

Необъяснимые аномалии в тайге на Дальнем Востоке: читаем походные дневники военного разведчика и писателя Владимира Арсеньева

Часть первая: свет в ночном море, мираж «фата-моргана» и почти моментальное замерзание воды...

15 дек 2025 8 197

ЦРУ, море в пустыне и нефть: кто и зачем остановил проект Египта на 60 лет?

Часть вторая: Холодная война, 200 ядерных взрывов и 15 миллиардов, которые могут все изменить...

13 дек 2025 6 966

Меньше трех дней до конца света на орбите: почему программа CRASH Clock бьет тревогу?

Сотрудники Маска уверяют, что у них все под контролем. Но эксперты сравнивают орбиту с карточным домиком. Кто же прав?...

16 дек 2025 6 030

Что стоит за таинственными аномалиями в дальневосточной тайге? Продолжаем читать походные дневники военного разведчика и писателя Владимира Арсеньева

Часть вторая: снежная гроза, феномен моретрясения и встреча со «снежным человеком»...

16 дек 2025 5 111

Египет хотел создать МОРЕ в пустыне Сахара: почему проект заморозили на 60 лет?

Первая «чернокожая британка» оказалась белой: новое исследование заставило историков полностью пересмотреть портрет женщины из Бичи-Хед

Почему ученые так сильно ошиблись с ее внешностью? И стоит ли после этого доверять реконструкциям по ДНК?...

Сегодня, 14:28 612

Тестировщики чат-бота обнаружили его способность изощрённо лгать

Новое исследование показало: Стоунхендж столетиями «водил за нос». Похоже, историю опять придется переписывать

Людовик XIV умер совсем не от гангрены: ученые сумели раскрыть истину лишь 310 лет спустя

Необъяснимые аномалии в тайге на Дальнем Востоке: читаем походные дневники военного разведчика и писателя Владимира Арсеньева

ЦРУ, море в пустыне и нефть: кто и зачем остановил проект Египта на 60 лет?

Меньше трех дней до конца света на орбите: почему программа CRASH Clock бьет тревогу?

Что стоит за таинственными аномалиями в дальневосточной тайге? Продолжаем читать походные дневники военного разведчика и писателя Владимира Арсеньева

Египет хотел создать МОРЕ в пустыне Сахара: почему проект заморозили на 60 лет?

Российский ученый уверен, что максимально приблизился к разгадке тайны шаровой молнии

Темная сторона Рима: выяснилось, что Империя веками «выкачивала» здоровье из покоренных народов

Загадочная письменность Б из пещер у Мертвого моря наконец-то расшифрована

Встречи с неведомым: завершаем чтение дневников разведчика и писателя Владимира Арсеньева

Парадокс Великой Зеленой стены: Китай посадил 78 миллиардов новых деревьев, но климат стал только хуже. Как так вышло?

Первая «чернокожая британка» оказалась белой: новое исследование заставило историков полностью пересмотреть портрет женщины из Бичи-Хед