ChatGPT теперь поддерживает голосовые чаты и запросы на основе изображений
ChatGPT получил ряд существенных обновлений, которые позволят чат-боту обрабатывать голосовые команды и запросы на основе изображений. Пользователи смогут вести голосовой разговор с ChatGPT на Android и iOS и загружать в него изображения на всех платформах. Сейчас OpenAI внедряет новые функции. Сначала они будут доступны пользователям Plus и Enterprise, а другие пользователи получат доступ к функциям на основе изображений позже.
Вы можете включить голосовые чаты в приложении ChatGPT (перейдите в «Настройки», затем «Новые функции»), если хотите их опробовать. Нажав кнопку микрофона, вы сможете выбрать один из пяти вариантов голоса.
OpenAI утверждает, что двусторонние голосовые разговоры основаны на новой модели преобразования текста в речь, которая может генерировать «человеческий звук из текста и нескольких секунд образца речи». Пять голосов были созданы с помощью профессиональных актеров.
— OpenAI.
Функции, основанные на работе с изображениями также интересны. OpenAI утверждает, что вы можете показать чат-боту фотографию вашего гриля и спросить, почему он не запускается, попросить составить рецепт на основе того, что находится в вашем холодильнике, или предложить ему решить математическую задачу.
OpenAI использует GPT-3.5 и GPT-4 для реализации функций распознавания изображений. Чтобы использовать функции ChatGPT на основе изображений, нажмите кнопку фотографии (сначала вам нужно нажать кнопку «плюс» на iOS или Android), чтобы сделать снимок, или выберите существующее изображение на вашем устройстве. Вы можете задать ChatGPT несколько фотографий и использовать инструмент рисования, чтобы сосредоточиться на определенной части изображения.
В сообщении об анонсе обновления, OpenAI отметила и потенциальные негативне последствия. Приложение может имитировать голоса общественных деятелей (и обычных людей) и, возможно, совершать мошенничества. Вот почему OpenAI фокусируется на голосовых разговорах ChatGPT с использованием этой технологии и работает с избранными партнерами над другими ограниченными вариантами использования (подробнее об этом чуть позже).
Что касается изображений, OpenAI совместно с Be My Eyes разработал бесплатное приложение для слепых и слабовидящих людей. Приложение поможет им лучше понять свое окружение благодаря волонтерам, которые участвуют в видеозвонках вместе с ними.
— OpenAI.
Компания отметила, что она также ограничила возможности ChatGPT анализировать и делать прямые заявления о людях, появляющихся на изображениях, «поскольку ChatGPT не всегда точен, и система должна уважать конфиденциальность людей». Компания также опубликовала статью о принципах безопасности функциональности на основе изображений, которую она называет GPT-4 с видением.
ChatGPT достаточно хорошо понимает текст на английском языке в изображениях, чем на других языках. OpenAI утверждает, что чат-бот пока плохо работает на других языках, особенно когда речь идет о тех, которые используют нелатинские шрифты. Таким образом, это предполагает, что пользователи, не владеющие английским языком, пока не смогут полноценно использовать ChatGPT для работы с текстом в изображениях.
Тем временем Spotify объединились с OpenAI, чтобы использовать голосовую технологию еще в одном проекте. Spotify анонсировал пилотную версию инструмента под названием Voice Translation для подкастеров. Это позволяет переводить подкасты на разные языки, используя голоса людей, которые появляются в шоу. Spotify утверждает, что инструмент может сохранять речевые характеристики оригинального говорящего после преобразования его голоса на другие языки.
Для начала Spotify конвертирует избранные англоязычные шоу на несколько языков. Испанские версии некоторых книг "Armchair Expert" и "Дневник генерального директора" с эпизодами Стивена Бартлетта, которые доступны уже сейчас. Также выйдут французский и немецкий варианты.
— Spotify News.
Вы можете включить голосовые чаты в приложении ChatGPT (перейдите в «Настройки», затем «Новые функции»), если хотите их опробовать. Нажав кнопку микрофона, вы сможете выбрать один из пяти вариантов голоса.
OpenAI утверждает, что двусторонние голосовые разговоры основаны на новой модели преобразования текста в речь, которая может генерировать «человеческий звук из текста и нескольких секунд образца речи». Пять голосов были созданы с помощью профессиональных актеров.
Используйте свой голос, чтобы участвовать в двустороннем разговоре с ChatGPT. Разговаривайте с ним на ходу, заказывайте сказку на ночь или разрешайте споры за обеденным столом
— OpenAI.
Функции, основанные на работе с изображениями также интересны. OpenAI утверждает, что вы можете показать чат-боту фотографию вашего гриля и спросить, почему он не запускается, попросить составить рецепт на основе того, что находится в вашем холодильнике, или предложить ему решить математическую задачу.
OpenAI использует GPT-3.5 и GPT-4 для реализации функций распознавания изображений. Чтобы использовать функции ChatGPT на основе изображений, нажмите кнопку фотографии (сначала вам нужно нажать кнопку «плюс» на iOS или Android), чтобы сделать снимок, или выберите существующее изображение на вашем устройстве. Вы можете задать ChatGPT несколько фотографий и использовать инструмент рисования, чтобы сосредоточиться на определенной части изображения.
В сообщении об анонсе обновления, OpenAI отметила и потенциальные негативне последствия. Приложение может имитировать голоса общественных деятелей (и обычных людей) и, возможно, совершать мошенничества. Вот почему OpenAI фокусируется на голосовых разговорах ChatGPT с использованием этой технологии и работает с избранными партнерами над другими ограниченными вариантами использования (подробнее об этом чуть позже).
Что касается изображений, OpenAI совместно с Be My Eyes разработал бесплатное приложение для слепых и слабовидящих людей. Приложение поможет им лучше понять свое окружение благодаря волонтерам, которые участвуют в видеозвонках вместе с ними.
Пользователи сказали нам, что для них ценно вести общие разговоры об изображениях, на которых изображены люди на заднем плане, например, если кто-то появляется по телевизору, пока вы пытаетесь выяснить настройки своего пульта дистанционного управления
— OpenAI.
Компания отметила, что она также ограничила возможности ChatGPT анализировать и делать прямые заявления о людях, появляющихся на изображениях, «поскольку ChatGPT не всегда точен, и система должна уважать конфиденциальность людей». Компания также опубликовала статью о принципах безопасности функциональности на основе изображений, которую она называет GPT-4 с видением.
ChatGPT достаточно хорошо понимает текст на английском языке в изображениях, чем на других языках. OpenAI утверждает, что чат-бот пока плохо работает на других языках, особенно когда речь идет о тех, которые используют нелатинские шрифты. Таким образом, это предполагает, что пользователи, не владеющие английским языком, пока не смогут полноценно использовать ChatGPT для работы с текстом в изображениях.
Тем временем Spotify объединились с OpenAI, чтобы использовать голосовую технологию еще в одном проекте. Spotify анонсировал пилотную версию инструмента под названием Voice Translation для подкастеров. Это позволяет переводить подкасты на разные языки, используя голоса людей, которые появляются в шоу. Spotify утверждает, что инструмент может сохранять речевые характеристики оригинального говорящего после преобразования его голоса на другие языки.
Для начала Spotify конвертирует избранные англоязычные шоу на несколько языков. Испанские версии некоторых книг "Armchair Expert" и "Дневник генерального директора" с эпизодами Стивена Бартлетта, которые доступны уже сейчас. Также выйдут французский и немецкий варианты.
Мечтаете ли вы о мире, в котором некоторые из лучших подкастов будут звучать на вашем родном языке? Что ж, теперь это возможно. Мы рады запустить пилотный проект Voice Translation, революционной функции на базе искусственного интеллекта, которая переводит подкасты на дополнительные языки — и все это в личном кабинете подкастера
— Spotify News.
- Алексей Павлов
- ASSOCIATED PRESS
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Бомбы с орбиты: почему советская технология, воскрешенная Китаем, встревожила США?
Американцы слишком долго считали свои системы раннего предупреждения лучшими на планете. Теперь......
Битва под Каневом: почему на 350 лет замолчали сокрушительную победу России?
Неудобная победа, предательство и идеология. Мы бы могли вообще не узнать об этом триумфе русского оружия...
С Ноева ковчега сняли запрет: что покажут радары на Арарате?
История, которую больше всего высмеивали ученые, неожиданно становится все более реальной...
Дикий народ чучуна: Кто наводил ужас на коренное население Сибири?
Йети? Люди-изгои? Древнее племя? Пока что вопросов больше, чем ответов...
Почему их ДНК не меняется уже 42 000 лет: определен самый древний народ на планете
Три раза предки жителей Океании встречались с исчезнувшими видами людей, и это в корне изменило их гены...
Мрачный прогноз для США из 1995 года сбылся: в чем великий ученый Саган оказался прав?
Исследователь говорил: все плохо, но еще не все потеряно. Его советы могут реально помочь всему человечеству...
Тайна «косого глаза» Венеры раскрыта: что увидела нейросеть на картинах Боттичелли?
Художник нарисовал пять портретов прекрасной Симонетты Веспуччи. И каждое полотно еще больше подтверждает страшный диагноз...
Новая вселенная внутри звезды: почему Эйнштейн мог ошибаться насчет черных дыр
Больше 20 лет эта гипотеза в буквальном смысле раздирает мир науки. Но, возможно, именно она выведет ученых из тупика сингулярности...
Снегопады в Антарктиде становятся все аномальнее: и ученые, наконец-то, знают почему?
Ученым придется пересмотреть все климатические модели Шестого континента. Кстати, снега там будет выпадать с каждым годом все больше...
Тайный Еще одна тайна майя: археологи секрет алтаря в заброшенном городе
Выяснилось, что индейцы долгие столетия продолжали исповедовать, казалось бы, давно забытый древний культ...
Марс под вопросом: что может обнулить иммунитет у космонавтов?
И почему защита организма перестает видеть микробы, выжившие в космосе?...
43 — проклятый возраст Рюриковичей: почему многие князья не переживали этот роковой рубеж?
Генетики говорят: русская династия слишком поздно поняла, что попала в ловушку «чистой» крови...
Доказана жизнь на спутнике Юпитера: как же бактериям удалось добраться с Земли на Европу?
За 3,5 миллиарда лет земные бактерии могли долететь до 105 звездных систем. Так что у Европы есть все шансы на «заражение»...
Бельгийскую разведку снова взломали: хакеры целый год качали оттуда секретные данные
Эксперты говорят: проникновение было замечено совершенно случайно. И это пугает...
Сначала Стоунхендж был... не каменным: найден прототип легендарного святилища
Доисторическая религия оказалась старше на 500 лет, чем считали ученые. И она играла огромную роль в жизни древних людей...
Кипящая дыра в Йеллоустоуне: почему геологи «проморгали» опасный инцидент?
Геологический детектив: незамеченный взрыв, неожиданный провал и далеко идущие последствия...