Pessoa conversando com assistente de voz em smartphone com interface de IA visualizada em ondas de áudio

ChatGPT ganha nova IA que fala e ouve ao mesmo tempo e imita conversa humana

A OpenAI iniciou a liberação de um novo modelo de voz para o ChatGPT que permite conversas mais naturais, com a capacidade de falar e ouvir ao mesmo tempo. Além disso, a atualização aproxima ainda mais a inteligência artificial de uma interação humana em tempo real, o que representa um avanço importante na tecnologia de assistentes de voz.

Nova IA do ChatGPT melhora conversas por voz

De acordo com informações divulgadas pelo Canaltech, o novo sistema de voz bidirecional, chamado internamente de “GPT-Bidi-1”, altera a forma como o usuário interage com o ChatGPT. Dessa forma, a IA deixa de seguir um formato rígido de pergunta e resposta e passa a permitir uma conversa mais fluida.

Pessoa conversando com assistente de voz em smartphone com interface de IA visualizada em ondas de áudio

Foto: Reprodução

Além disso, a tecnologia já está sendo testada em um grupo limitado de usuários no aplicativo e na versão web. Por enquanto, a OpenAI ainda não fez um anúncio oficial completo sobre o lançamento global.

IA fala e ouve ao mesmo tempo

Com essa nova arquitetura, o ChatGPT consegue interpretar a fala do usuário enquanto responde simultaneamente. Assim, a conversa se torna mais natural e dinâmica, sem aquelas pausas tradicionais entre pergunta e resposta.

Por outro lado, essa mudança também permite que o usuário interrompa a IA no meio da fala, o que ajusta o rumo da conversa instantaneamente. Dessa forma, o sistema se aproxima mais de um diálogo humano real.

Tecnologia reduz interrupções e melhora fluidez

Além disso, a nova IA reduz os atrasos entre respostas e melhora a retenção de contexto durante conversas longas. Enquanto isso, o modelo também ajusta o ritmo da fala de forma mais natural, evitando respostas robóticas ou travadas.

Consequentemente, a experiência de uso se torna mais contínua e menos fragmentada, o que melhora a interação geral com o sistema.

OpenAI aposta em futuro da comunicação por voz

A OpenAI acredita que a voz será uma das principais formas de interação com inteligência artificial nos próximos anos. Por isso, a empresa vem investindo em modelos que tornam a comunicação mais rápida, intuitiva e acessível.

Além disso, o novo sistema também faz parte de uma evolução maior da plataforma, que já vem incorporando recursos multimodais, como texto, imagem e áudio integrados.

A funcionalidade está sendo liberada de forma gradual para usuários selecionados. Dessa forma, a expectativa é que a tecnologia chegue a mais pessoas ao longo dos próximos meses, conforme os testes avancem.

Fonte: Canal Tech

Seguir
Buscar
Carregando

Signing-in 3 seconds...

Signing-up 3 seconds...