OpenAI dá ao ChatGPT uma voz para conversas verbais

Advertising


ChatGPT está evoluindo para muito mais do que um mecanismo de pesquisa fundamentado em texto, com a OpenAI anunciando hoje que está adicionando novos recursos inteligentes baseados em voz e imagem à mistura.

Advertising

O popular assistente generativo de IA tem sido uma das maiores histórias de sucesso tecnológico dos últimos tempos, desde sua estreia, há murado de nove meses, permitindo que qualquer pessoa gere ensaios, poemas e resumos a partir de simples instruções baseadas em texto. Mas agora, o ChatGPT está prestes a permanecer muito mais interativo, com os usuários também podendo ter uma conversa por voz com o chatbot.

O pregão ocorre no mesmo dia em que a Amazon se comprometeu a investir até US$ 4 bilhões na rival OpenAI, Anthropic, um movimento que constitui secção de uma guerra maior de IA generativa entre os gigantes da tecnologia do mundo, que inclui o Google tentando restaurar o detença por meio de seu chatbot Bard. , Meta adotando um espírito firme de código descerrado para ajudá-lo a obter uma vantagem, e a Microsoft se alinhando estreitamente com o próprio OpenAI.

Advertising

Iniciador de conversa

Hoje marca uma evolução notável para o movimento generativo da IA, com a OpenAI mesclando o mundo familiar dos assistentes baseados em voz com seus poderosos modelos de linguagem grande (LLMs).

Por exemplo, um usuário poderá pedir verbalmente ao ChatGPT para inventar uma história para dormir na hora, com algumas instruções vocais para orientar a narrativa. Ou o usuário pode simplesmente fazer uma pergunta, com o ChatGPT dando sua resposta em forma de termo falada.

Em outros lugares, os usuários do ChatGPT também poderão procurar respostas usando imagens, por exemplo, enviando uma imagem de um pouco e pedindo ao ChatGPT que explique o que é ou forneça instruções para completar uma meta.

Pesquisa de imagens ChatGPT

Pesquisa de imagens ChatGPT Créditos da imagem: OpenAI

O recurso de voz é nutrido por um novo protótipo de conversão de texto em fala que pode gerar vozes semelhantes às humanas a partir de texto e alguns segundos de modelo de fala. A OpenAI disse que se uniu a dubladores estabelecidos para fabricar cinco vozes diferentes, com seu sistema de reconhecimento de fala Whisper de código descerrado usado para transcrever declarações verbais em texto.

O Spotify também foi apresentado porquê parceiro de lançamento, com a gigante do streaming de música introduzindo um novo recurso bastante interessante para podcasters que lhes permite testar sua voz e trasladar seus programas do inglês para o espanhol, gaulês ou teutónico – mantendo sua própria voz original. . No entanto, parece que a OpenAI está tomando zelo para não atrair críticas, pois não está disponibilizando essa tecnologia para ninguém – ela trabalhou especificamente com podcasters porquê Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlett para o lançamento.

“A novidade tecnologia de voz – capaz de fabricar vozes sintéticas realistas a partir de somente alguns segundos de fala real – abre portas para muitas aplicações criativas e focadas na acessibilidade”, escreveu a empresa em um blog. “No entanto, estas capacidades também apresentam novos riscos, porquê a possibilidade de intervenientes mal-intencionados se passarem por figuras públicas ou cometerem fraude”.

Os novos recursos começarão a ser implementados para assinantes Plus e Enterprise nas próximas duas semanas. Para ativar os recursos de voz, os usuários precisam ir ao menu “configurações” no aplicativo, depois ir para “novos recursos” e ativar conversas de voz. Eles logo precisam tocar no botão do fone de ouvido no quina superior recta e selecionar a voz desejada.

A voz será limitada inicialmente aos aplicativos ChatGPT para Android e iOS em uma versão beta opcional, enquanto a pesquisa de imagens chegará a todas as plataformas por padrão.

Pablo Oliveira
Pablo Oliveirahttp://pcextreme.com.br
Sou diretamente responsável pela manutenção, otimização, configuração e SEO de todos os sites de minha propriedade. Além disso, atuo como colunista, editor e programador.

Artigos relacionados

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui

Artigos recentes