Transcreva voz em texto através de bibliotecas cliente
Esta página mostra-lhe como enviar um pedido de reconhecimento de voz para o Speech-to-Text no seu idioma de programação favorito através das bibliotecas cliente da Google Cloud.
A conversão de voz em texto permite a integração fácil das tecnologias de reconhecimento de voz da Google nas aplicações dos programadores. Pode enviar dados de áudio para a API Speech-to-Text, que devolve uma transcrição de texto desse ficheiro de áudio. Para mais informações acerca do serviço, consulte o artigo Noções básicas de conversão de voz em texto.
Antes de começar
Antes de poder enviar um pedido para a API Speech-to-Text, tem de ter concluído as seguintes ações. Consulte a página antes de começar para ver detalhes.
- Ative o Speech-to-Text num projeto do Google Cloud.
- Certifique-se de que a faturação está ativada para o Speech-to-Text.
-
Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:
gcloud init
Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.
- (Opcional) Crie um novo contentor do Google Cloud Storage para armazenar os seus dados de áudio.
Instale a biblioteca de cliente
Go
go get cloud.google.com/go/speech/apiv1
Java
If you are using Maven, add
the following to your pom.xml
file. For more information about
BOMs, see The Google Cloud Platform Libraries BOM.
If you are using Gradle, add the following to your dependencies:
If you are using sbt, add the following to your dependencies:
If you're using Visual Studio Code, IntelliJ, or Eclipse, you can add client libraries to your project using the following IDE plugins:
The plugins provide additional functionality, such as key management for service accounts. Refer to each plugin's documentation for details.
Node.js
Antes de instalar a biblioteca, certifique-se de que preparou o seu ambiente para o desenvolvimento de Node.js.
npm install @google-cloud/speech
Python
Antes de instalar a biblioteca, certifique-se de que preparou o seu ambiente para o desenvolvimento em Python.
pip install --upgrade google-cloud-speech
Faça um pedido de transcrição de áudio
Agora, pode usar a conversão de voz em texto para transcrever um ficheiro de áudio
em texto. Use o seguinte código para enviar um pedido recognize
à API Speech-to-Text.
Go
Java
Node.js
Antes de executar o exemplo, certifique-se de que preparou o seu ambiente para o desenvolvimento de Node.js.
Python
Antes de executar o exemplo, certifique-se de que preparou o seu ambiente para o desenvolvimento em Python.
Parabéns! Enviou o seu primeiro pedido de conversão de voz em texto.
Se receber um erro ou uma resposta vazia do serviço Speech-to-Text, consulte os passos de resolução de problemas e mitigação de erros.
Limpar
Para evitar incorrer em cobranças na sua Google Cloud conta pelos recursos usados nesta página, siga estes passos.
- Use o Google Cloud console para eliminar o projeto se não precisar dele.
O que se segue?
- Pratique a transcrição de ficheiros de áudio curtos.
- Saiba como processar em lote ficheiros de áudio longos para reconhecimento de voz.
- Saiba como transcrever áudio em streaming, como o de um microfone.
- Comece a usar a conversão de voz em texto no idioma da sua escolha através de uma biblioteca de cliente de conversão de voz em texto.
- Trabalhe com as aplicações de exemplo.
- Para o melhor desempenho, precisão e outras sugestões, consulte a documentação de práticas recomendadas.