Как опытный энтузиаст искусственного интеллекта и поклонник технологий, который был свидетелем эволюции разговоров с использованием искусственного интеллекта с момента его скромного текстового зарождения, я должен сказать, что расширенный голосовой режим для ChatGPT действительно вызвал у меня интерес. За годы работы с различными моделями искусственного интеллекта я могу подтвердить преобразующую силу этой функции, позволяющую еще больше сократить разрыв между взаимодействием человека и машины.
Последним дополнением к ChatGPT является инновационная функция под названием «Расширенный диалоговый интерфейс». Эта функция позволяет пользователям вести беспрепятственные, человеческие беседы с чат-ботом с искусственным интеллектом, устраняя необходимость в поле ввода текста или двустороннем аудиовзаимодействии. Первоначально представленный на мероприятии OpenAI Spring Update, он был развернут для избранных подписчиков Plus ближе к концу июля после его разработки.
Как исследователь, изучающий эту инновационную технологию, я рад сообщить, что новая функция обещает более аутентичный опыт взаимодействия в реальном времени. Он позволяет прерывать работу в любой момент и интуитивно реагирует на ваши эмоции. Интересно, что он может даже имитировать человеческий смех и делать паузы во время разговора, делая разговор более естественным. Интересная новость заключается в том, что доступ к этой функции скоро появится для тех, кто еще не опробовал ее!
Когда я получу расширенный режим?
Буквально на прошлой неделе OpenAI представила свою долгожданную функцию Advanced Voice ограниченному числу пользователей ChatGPT-Plus. Следовательно, некоторые люди уже этим пользуются. Масштабы предварительного релиза и темпы, с которыми OpenAI набирает новых участников, остаются неясными.
Компания планирует сделать эту функцию доступной для большего числа пользователей в течение следующих нескольких недель, а к осени доступ к ней получат все подписчики Plus. Однако некоторые пользователи стремятся использовать его как можно скорее. Проще говоря, вы можете рассчитывать на возможность использовать его до осени, при условии, что не будет дополнительных неудач. Хотя «осень» может показаться неопределенным, если мы не станем свидетелями полного развертывания для всех пользователей к декабрю, это можно считать задержкой.
Как заядлый пользователь, я могу заверить вас, что как только вы получите приглашение – по электронной почте или при открытии приложения ChatGPT – вы будете готовы погрузиться в работу и ощутить всю мощь этого инструмента на себе!
Что мне нужно для запуска расширенного голосового режима на моем телефоне?
Помимо подписки на план Plus, пользователям требуется устройство Android с приложением версии 1.2024.206 или выше или iPhone на iOS 16.4 или новее с той же версией приложения. Однако наличие необходимого оборудования не дает вам автоматически права на фазу альфа-релиза. Кроме того, OpenAI не раскрыла никакой информации о своем процессе отбора или критериях выбора пользователей.
Если вам посчастливится быть выбранным в розыгрыше альфа-релиза, вы получите электронное письмо от OpenAI по этому поводу. Кроме того, вы увидите всплывающее уведомление в правом нижнем углу мобильного интерфейса ChatGPT, которое позволит вам выбрать новейшую функцию.
Собирается ли OpenAI использовать мои разговоры для обучения своей модели?
Абсолютно! На начальном этапе альфа-версии OpenAI намерена использовать голосовые записи разговоров, используя свой расширенный голосовой режим для обучения моделей. Это возможно только в том случае, если вы не отключили функцию обмена данными приложения.
Вместо этого позвольте мне провести вас через простой процесс. Перейдите в раздел «Управление данными» в настройках вашего приложения, затем снимите флажок с параметра «Улучшить голос для всех».
Как часто и сколько раз я могу использовать расширенный голосовой режим?
На основе OpenAI взаимодействие Advanced Voice, как входное, так и выходное, имеет ежедневные ограничения на использование, но нет никакой точной информации о том, как долго будут действовать эти ограничения. Также стоит отметить, что эти ограничения могут быть скорректированы со временем. Тем не менее, пользователь Himels Tech уже поделился видео, на котором они взаимодействовали с ИИ примерно 10 минут.
Как разговорный аналитик, я бы разработал ИИ, который бы мягко напоминал пользователям, когда до конца нашего взаимодействия в чате осталось всего три минуты. Чтобы обеспечить плавный переход, он затем корректно завершит разговор и вернет управление стандартному голосовому интерфейсу.
Что я могу и чего не могу делать с расширенным голосовым режимом?
Хан!!!!!!
— Итан Сутин (@EthanSutin) 30 июля 2024 г.
По сути, расширенный голосовой режим — это новый метод взаимодействия с той же большой языковой моделью GPT-4o, с которой пользователи взаимодействуют для текстовых запросов. По сути, если вы можете выполнять задачи с помощью ChatGPT, вы можете выполнять их и с помощью Advanced Voice; тем не менее, он предлагает дополнительный элемент развлечения благодаря различным вариантам голоса, от битбокса до рассказывания историй и быстрого счета. Предварительные пользователи уже активно экспериментируют с этой новой функцией.
В новом режиме установлены определенные границы запросов пользователя, а также ограничения его возможностей. Например, пользователи не могут создавать новые воспоминания с помощью Advanced Voice, а также предоставлять собственные инструкции или взаимодействовать с GPT с помощью этой функции. Более того, хотя ИИ способен запоминать прошлые разговоры, проведенные в расширенном голосовом режиме, и вспоминать детали этих обсуждений, в настоящее время он не может получить доступ к предыдущим текстовым чатам или разговорам, проведенным в стандартном голосовом режиме.
Кроме того, важно отметить, что даже если вы этого попросите, Advanced Voice не будет петь. Это мера, принятая компанией для защиты прав создателей. Они внедрили новые фильтры и ограничения, чтобы гарантировать, что расширенный голосовой режим не создает музыкальный контент, например пение.
Смотрите также
- На фотографии iPhone 16 Pro Max видны удивительно тонкие рамки
- Концовка «Субстанции» объясняет: что происходит со Сью и Элизабет?
- Эта функция Apple Watch сводила меня с ума. Вот как я это исправил
- Если вы скучаете по старым Windows Phone от Nokia, вам понравится HMD Skyline.
- Приложение Google Gemini AI получает более широкую версию. Ваш телефон есть в списке?
- Xiaomi Mix Fold 4 против Xiaomi Mix Flip: в чем разница?
- Что лучше: Dell Latitude или Inspiron?
- Является ли Apple iPhone 16 водонепроницаемым?
- Как записать собрание Microsoft Teams
- Новый патент Xiaomi на смартфон — один из самых диких, которые я когда-либо видел
2024-08-05 22:27