Real Voice é um plugin versátil de conversão de texto em fala para WordPress. Ele oferece suporte a todos os principais serviços de conversão de texto em voz em um único pacote conveniente.
Ele vem com um reprodutor de áudio personalizável, um painel dedicado para monitorar as chamadas de API para os serviços de conversão de texto em fala e muitas opções de personalização.
Serviços de conversão de texto em fala com suporte
SPEECHSYNTHESIS (API DE FALA DA WEB)
Esta opção permite utilizar as funcionalidades de conversão de texto em voz incluídas no navegador sem assinar um serviço em nuvem.
Tecnicamente, a conversão de texto em fala é realizada usando a interface SpeechSynthesis da Web Speech API . Agora, a síntese de voz tornou-se uma solução viável para qualquer site de produção, uma vez que todos os principais navegadores agora a suportam.
As opções de personalização disponibilizadas pelo SpeechSynthesis estão disponíveis nas configurações do plugin Real Voice:
- Idioma – Com esta opção, você pode selecionar o idioma do enunciado.
- Voz – Selecione uma das vozes disponíveis no navegador do usuário.
- Tom – O valor do tom determina a “altura” ou “baixa” percebida da voz gerada.
- Taxa – Selecione a velocidade com que o enunciado deve ser falado.
- Volume – Isso determina o valor do volume
AMAZON POLLY
Amazon Polly é um serviço em nuvem que converte texto em áudio falado que faz parte da Amazon Web Services (AWS) .
Ele oferece suporte a uma ampla seleção de vozes padrão (TTS) e neurais (NTTS) para quase todos os idiomas.
No plugin Real Voice, incluímos todas as opções essenciais para aproveitar ao máximo o Amazon Polly. Especificamente, você poderá configurar:
- Região da AWS – a região da AWS que você prefere usar.
- ID de voz – Selecione uma das muitas vozes disponíveis no Amazon Polly.
- Motor – Selecione entre Padrão e Neural. Recomendamos o uso do mecanismo Neural para produzir vozes de texto para fala mais naturais e humanas possíveis.
- Código de idioma – selecione um dos códigos de idioma suportados pelo Amazon Polly.
- Nomes de léxicos – Aqui você pode definir os nomes de léxicos que deseja aplicar durante a síntese.
- Formato de saída – Você pode selecionar entre mp3 ou ogg_vorbis.
- Taxa de amostragem – Várias taxas de amostragem estão disponíveis.
- Tipo de texto – Texto simples ou SSML são suportados.
Para obter mais informações, consulte os recursos do Amazon Polly aqui .
IA DE CONVERSÃO DE TEXTO EM FALA DO GOOGLE
Text-to-Speech AI é um serviço disponível no Google Cloud que converte texto em fala com som natural usando uma API desenvolvida com o melhor das tecnologias de IA do Google.
Este serviço suporta um grande número de vozes e idiomas . O Google categoriza as vozes com base na tecnologia usada para produzi-las. Detalhes técnicos sobre isso estão disponíveis aqui .
É fácil configurar o áudio gerado pelo Google Text-to-Speech AI com as opções incluídas nas configurações do Real Voice:
- Codificação de Áudio – Esta opção permite selecionar a codificação dos arquivos de áudio.
- Taxa de fala – Aqui, você pode selecionar a velocidade com que a expressão é falada.
- Tom – Selecione o agudo ou grave relativo da voz.
- Ganho – O ganho de volume aplicado ao áudio produzido.
- ID do perfil de efeitos – Com esta opção, você pode aplicar perfis de áudio específicos à fala gerada.
- Código do idioma – Aqui você pode selecionar o idioma do enunciado.
- Nome da voz – Use este campo para escolher uma das muitas vozes que o serviço oferece.
TEXTO DO AZURE PARA FALA
Texto em fala é um serviço disponível no Microsoft Azure que converte texto em fala realista.
Este poderoso serviço vem com uma grande variedade de vozes que você pode testar na galeria de vozes .
Vamos ver as opções de conversão de texto em fala do Azure incluídas no plugin Real Voice:
- Região – Selecione a região do Azure que melhor atende às suas necessidades.
- User Agent – Valor customizado utilizado para identificar as solicitações realizadas pelo plugin Real Voice ao serviço em nuvem.
- Formato de saída – O formato no qual os arquivos de áudio devem ser codificados. Esta opção determina a qualidade e o espaço ocupado pelos arquivos de áudio gerados.
ONZELABS
ElevenLabs é uma empresa de software que desenvolve síntese de fala com som natural e software de conversão de texto em fala usando inteligência artificial e aprendizado profundo.
Este serviço pode gerar áudio em vários idiomas usando os seguintes modelos de IA .
No Real Voice, incluímos estas opções do ElevenLabs:
- ID de voz – Esta opção determina a voz a ser usada.
- Otimizar latência de streaming – Use esta opção para otimizar o processo generativo da IA.
- Estabilidade – Selecione o quão estável é a voz e a aleatoriedade entre cada geração.
- Aumento de similaridade – Otimize para obter vozes claras e sem artefatos ou aprimore a semelhança dos alto-falantes.
- Estilo – Selecione o estilo da voz.
Manual do plug-in
Consulte a base de conhecimento para obter instruções sobre como instalar, atualizar e usar o plug-in.