La detección de texto aplica el reconocimiento óptico de caracteres (OCR), que detecta y extrae texto de un vídeo de entrada.
La detección de texto está disponible en todos los idiomas compatibles con la API Cloud Vision.
Solicitar la detección de texto en un vídeo de Cloud Storage
En los siguientes ejemplos se muestra cómo detectar texto en un archivo ubicado en Cloud Storage.
REST
Enviar solicitud de anotación de vídeo
A continuación, se muestra cómo enviar una solicitud POST al método videos:annotate
. En el ejemplo se usa Google Cloud CLI para crear un token de acceso. Para obtener instrucciones sobre cómo instalar gcloud CLI, consulta la guía de inicio rápido de la API Video Intelligence.
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
- INPUT_URI: un segmento de Cloud Storage que contiene
el archivo que quieres anotar, incluido el nombre del archivo. Debe
empezar por
gs://
.
Por ejemplo:"inputUri": "gs://cloud-videointelligence-demo/assistant.mp4",
- LANGUAGE_CODE: [Opcional] Por ejemplo, "es-ES"
- PROJECT_NUMBER: identificador numérico de tu Google Cloud proyecto
Método HTTP y URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
Cuerpo JSON de la solicitud:
{ "inputUri": "INPUT_URI", "features": ["TEXT_DETECTION"], "videoContext": { "textDetectionConfig": { "languageHints": ["LANGUAGE_CODE"] } } }
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir una respuesta JSON similar a la siguiente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID" }
Si la respuesta es correcta, la API Video Intelligence devuelve el name
de tu operación. En el ejemplo anterior se muestra una respuesta de este tipo, donde project-number
es el número de tu proyecto y operation-id
es el ID de la operación de larga duración creada para la solicitud.
- PROJECT_NUMBER: el número de tu proyecto
- LOCATION_ID: la región de Cloud en la que se debe realizar la anotación. Las regiones de nube admitidas son
us-east1
,us-west1
,europe-west1
yasia-east1
. Si no se especifica ninguna región, se determinará una en función de la ubicación del archivo de vídeo. - OPERATION_ID: el ID de la operación de larga duración creada
para la solicitud y proporcionada en la respuesta cuando iniciaste la
operación. Por ejemplo,
12345...
.
Obtener resultados de anotación
Para obtener el resultado de la operación, haz una solicitud GET con el nombre de la operación devuelto por la llamada a videos:annotate, como se muestra en el siguiente ejemplo.
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
- OPERATION_NAME: el nombre de la operación tal como lo devuelve la API Video Intelligence. El nombre de la operación tiene el formato
projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID
- PROJECT_NUMBER: identificador numérico de tu Google Cloud proyecto
Método HTTP y URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir una respuesta JSON similar a la siguiente:
Las anotaciones de detección de texto se devuelven como una listatextAnnotations
.
Nota: El campo done solo se devuelve cuando su valor es True.
No se incluye en las respuestas de las operaciones que no se han completado.
Descargar resultados de anotación
Copia la anotación del segmento de origen al de destino (consulta Copiar archivos y objetos).
gcloud storage cp gcs_uri gs://my-bucket
Nota: Si el usuario proporciona el URI de GCS de salida, la anotación se almacenará en ese URI.
Go
Java
Para autenticarte en Video Intelligence, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Node.js
Para autenticarte en Video Intelligence, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Python
Para autenticarte en Video Intelligence, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Idiomas adicionales
C#: Sigue las instrucciones de configuración de C# en la página de bibliotecas de cliente y, a continuación, consulta la documentación de referencia de Video Intelligence para .NET.
PHP Sigue las instrucciones de configuración de PHP en la página de bibliotecas de cliente y, a continuación, consulta la documentación de referencia de Video Intelligence para PHP.
Ruby: Sigue las instrucciones de configuración de Ruby en la página de bibliotecas de cliente y, a continuación, consulta la documentación de referencia de Video Intelligence para Ruby.
Solicitar la detección de texto en un vídeo de un archivo local
En los siguientes ejemplos se muestra cómo detectar texto en un archivo almacenado de forma local.
REST
Enviar solicitud de anotación de vídeo
Para anotar un archivo de vídeo local, asegúrate de codificar en base64 el contenido del archivo de vídeo.
Incluye el contenido codificado en base64 en el campo inputContent
de la solicitud.
Para obtener información sobre cómo codificar en Base64 el contenido de un archivo de vídeo, consulta Codificación Base64.
A continuación, se muestra cómo enviar una solicitud POST al método videos:annotate
.
En el ejemplo se usa Google Cloud CLI para crear un token de acceso.
Para obtener instrucciones sobre cómo instalar Google Cloud CLI, consulta la guía de inicio rápido de la API Video Intelligence.
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
- "inputContent": BASE64_ENCODED_CONTENT
Por ejemplo:
"UklGRg41AwBBVkkgTElTVAwBAABoZHJsYXZpaDgAAAA1ggAAxPMBAAAAAAAQCAA..."
- LANGUAGE_CODE: [Opcional] Por ejemplo, "es-ES"
- PROJECT_NUMBER: identificador numérico de tu Google Cloud proyecto
Método HTTP y URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
Cuerpo JSON de la solicitud:
{ "inputContent": "BASE64_ENCODED_CONTENT", "features": ["TEXT_DETECTION"], "videoContext": { "textDetectionConfig": { "languageHints": ["LANGUAGE_CODE"] } } }
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir una respuesta JSON similar a la siguiente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID" }
Si la respuesta es correcta, la API Video Intelligence devuelve el name
de tu operación. En el ejemplo anterior se muestra una respuesta de este tipo, donde project-number
es el nombre de tu proyecto y operation-id
es el ID de la operación de larga duración creada para la solicitud.
- OPERATION_ID: se proporciona en la respuesta cuando iniciaste la operación, por ejemplo,
12345...
Obtener resultados de anotación
Para obtener el resultado de la operación, haz una solicitud GET con el nombre de la operación devuelto por la llamada a videos:annotate, como se muestra en el siguiente ejemplo.
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
- PROJECT_NUMBER: identificador numérico de tu Google Cloud proyecto
Método HTTP y URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir una respuesta JSON similar a la siguiente:
Las anotaciones de detección de texto se devuelven como una lista textAnnotations
.
Nota: El campo done solo se devuelve cuando su valor es True.
No se incluye en las respuestas de las operaciones que no se han completado.
Go
Java
Node.js
Para autenticarte en Video Intelligence, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Python
Idiomas adicionales
C#: Sigue las instrucciones de configuración de C# en la página de bibliotecas de cliente y, a continuación, consulta la documentación de referencia de Video Intelligence para .NET.
PHP Sigue las instrucciones de configuración de PHP en la página de bibliotecas de cliente y, a continuación, consulta la documentación de referencia de Video Intelligence para PHP.
Ruby: Sigue las instrucciones de configuración de Ruby en la página de bibliotecas de cliente y, a continuación, consulta la documentación de referencia de Video Intelligence para Ruby.