Ver métricas

En este tema se explica cómo ver las métricas de Apigee hybrid en un panel de control de Stackdriver.

Información sobre Stackdriver

Para obtener más información sobre las métricas, los paneles de control y Stackdriver, consulta los siguientes artículos:

Habilitar métricas híbridas

Para enviar métricas híbridas a Stackdriver, primero debes habilitar la recogida de métricas. Consulta Configurar la recogida de métricas para ver este procedimiento.

Acerca de los nombres y las etiquetas de las métricas híbridas

Si se habilita, Hybrid rellena automáticamente las métricas de Stackdriver. El prefijo del nombre de dominio de las métricas creadas por la opción híbrida es:

apigee.googleapis.com/

Por ejemplo, la métrica /proxy/request_count contiene el número total de solicitudes recibidas por un proxy de API. Por lo tanto, el nombre de la métrica en Stackdriver es el siguiente:

apigee.googleapis.com/proxy/request_count

Stackdriver le permite filtrar y agrupar datos de métricas en función de las etiquetas. Algunas etiquetas están predefinidas y otras las añade explícitamente el sistema híbrido. En la sección Métricas disponibles que se muestra a continuación, se enumeran todas las métricas híbridas disponibles y las etiquetas añadidas específicamente a una métrica que puede usar para filtrar y agrupar.

Ver métricas

En el siguiente ejemplo se muestra cómo ver métricas en Stackdriver:
  1. Abre el explorador de métricas de Monitoring en un navegador. Si ya estás en la consola de Stackdriver, selecciona Explorador de métricas.
  2. En Buscar tipo de recurso y métrica, localiza y selecciona la métrica que quieras examinar. Elige una métrica específica de la lista Métricas disponibles o busca una métrica. Por ejemplo, busca proxy/latencies:

    Introducir métrica

  3. Seleccione la métrica que quiera.
  4. Aplica filtros. Las opciones de filtro de cada métrica se muestran en Métricas disponibles. Por ejemplo, en el caso de la métrica proxy_latencies, las opciones de filtro son: org=org_name.
  5. Stackdriver muestra el gráfico de la métrica seleccionada.
  6. Haz clic en Guardar.

Crear un panel de control

Los paneles de control son una forma de ver y analizar los datos de métricas que le interesan. Stackdriver ofrece paneles predefinidos para los recursos y servicios que usas, y también puedes crear paneles personalizados.

Utiliza un gráfico para mostrar una métrica de Apigee en tu panel de control personalizado. Con los paneles de control personalizados, tienes un control total sobre los gráficos que se muestran y su configuración. Para obtener más información sobre cómo crear gráficos, consulta el artículo Crear gráficos.

En el siguiente ejemplo se muestra cómo crear un panel de control en Stackdriver y, a continuación, añadir gráficos para ver los datos de las métricas:

  1. Abre el explorador de métricas de Monitoring en un navegador y, a continuación, selecciona Paneles.
  2. Selecciona + Crear panel de control.
  3. Ponle un nombre al panel de control. Por ejemplo, Tráfico de solicitudes de proxy híbrido
  4. Haz clic en Confirmar.
  5. Sigue estos pasos con cada gráfico que quieras añadir al panel de control:

    1. En el panel de control, selecciona Añadir gráfico.
    2. Selecciona la métrica que quieras, tal como se describe en la sección Ver métricas.
    3. Completa el cuadro de diálogo para definir el gráfico.
    4. Haz clic en Guardar. Stackdriver muestra los datos de la métrica seleccionada.

Métricas disponibles

En las siguientes tablas se enumeran las métricas para analizar el tráfico proxy.

Métricas de tráfico de proxy, de destino y de servidor

El servicio Prometheus recoge y trata métricas (como se describe en Recogida de métricas) del tráfico de proxy, de destino y de servidor.

En la siguiente tabla se describen las métricas y las etiquetas que usa Prometheus. Estas etiquetas se usan en las entradas de registro de métricas.

Nombre de la métrica Etiqueta Uso
/proxy/request_count method Número total de solicitudes de proxy de API recibidas.
/proxy/response_count method response_code Número total de respuestas de proxy de API recibidas.
/proxy/latencies method Número total de milisegundos que se ha tardado en responder a una llamada. Este tiempo incluye la sobrecarga del proxy de API de Apigee y el tiempo del servidor de destino.
/target/request_count method

target_type

target_endpoint

Número total de solicitudes enviadas al destino del proxy.
/target/response_count method

response_code

target_type

target_endpoint

Número total de respuestas recibidas del destino del proxy.
/target/latencies method

response_code

target_type

target_endpoint

Número total de milisegundos que se ha tardado en responder a una llamada. Este tiempo no incluye la sobrecarga del proxy de API de Apigee.
/policy/latencies policy_name Número total de milisegundos que ha tardado en ejecutarse esta política con nombre.
/server/fault_count source

Número total de errores de la aplicación de servidor.

Por ejemplo, la aplicación podría ser apigee-runtime, apigee-synchronizer o apigee-udca. Usa la etiqueta pod_name para filtrar los resultados por aplicación.

/server/nio state Número de sockets abiertos.
/server/num_threads Número de subprocesos activos que no son daemons en el servidor.
/server/request_count method

type

Número total de solicitudes recibidas por la aplicación de servidor.

Por ejemplo, la aplicación podría ser apigee-runtime, apigee-synchronizer o apigee-udca. Usa la etiqueta pod_name para filtrar los resultados por aplicación.

/server/response_count method

response_code
type

Número total de respuestas enviadas por la aplicación del servidor.

Por ejemplo, la aplicación podría ser apigee-runtime, apigee-synchronizer o apigee-udca. Usa la etiqueta pod_name para filtrar los resultados por aplicación.

/server/latencies method

response_code
type

La latencia es la latencia en milisegundos introducida por la aplicación del servidor.

Por ejemplo, la aplicación podría ser apigee-runtime, apigee-synchronizer o apigee-udca. Usa la etiqueta pod_name para filtrar los resultados por aplicación.

/upstream/request_count method

type

Número de solicitudes enviadas por la aplicación de servidor a su aplicación upstream.

Por ejemplo, en el caso de apigee-synchronizer, el plano de control está en la parte superior. Por lo tanto, upstream/request_count de apigee-synchronizer es una métrica que indica las solicitudes que apigee-synchronizer ha enviado al plano de control.

/upstream/response_count method

response_code

type

Número de respuestas que ha recibido la aplicación de servidor de su aplicación upstream.

Por ejemplo, en el caso de apigee-synchronizer, el plano de control está en la parte superior. Por lo tanto, upstream/response_count de apigee-synchronizer es una métrica que indica las solicitudes que apigee-synchronizer ha recibido del plano de control.

/upstream/latencies method

response_code
type

Latencia incurrida en la aplicación del servidor upstream, en milisegundos.

Por ejemplo, en el caso de apigee-synchronizer, el plano de control está en la parte superior. Por lo tanto, upstream/latencies de apigee-synchronizer es una métrica que indica la latencia del plano de control.

Métricas de UDCA

El servicio Prometheus recoge y trata métricas (como se describe en Recogida de métricas) para el servicio UDCA del mismo modo que lo hace con otros servicios híbridos.

En la siguiente tabla se describen las métricas y las etiquetas que usa Prometheus en los datos de métricas de UDCA. Estas etiquetas se usan en las entradas de registro de métricas.

Nombre de la métrica Etiqueta Uso
/udca/server/local_file_oldest_ts dataset

state

Marca de tiempo, en milisegundos desde el inicio de la época de Unix, del archivo más antiguo del conjunto de datos.

Se calcula cada 60 segundos y no refleja el estado en tiempo real. Si la UDCA está actualizada y no hay archivos pendientes de subida cuando se calcula esta métrica, el valor será 0.

Si este valor sigue aumentando, significa que los archivos antiguos siguen en el disco.

/udca/server/local_file_latest_ts dataset

state

Marca de tiempo, en milisegundos desde el inicio de la época de Unix, del archivo más reciente del disco por estado.

Se calcula cada 60 segundos y no refleja el estado en tiempo real. Si la UDCA está actualizada y no hay archivos pendientes de subida cuando se calcula esta métrica, el valor será 0.

/udca/server/local_file_count dataset

state

Recuento del número de archivos del disco del pod de recogida de datos.

Lo ideal es que el valor sea cercano a 0. Un valor alto constante indica que no se están subiendo archivos o que el UDCA no puede subirlos lo suficientemente rápido.

Este valor se calcula cada 60 segundos y no refleja el estado de la UDCA en tiempo real.

/udca/server/total_latencies dataset

Intervalo de tiempo, en segundos, entre la creación del archivo de datos y la subida correcta del archivo de datos.

Los contenedores serán de 100 ms, 250 ms, 500 ms, 1 s, 2 s, 4 s, 8 s, 16 s, 32 s y 64 s.

Histograma de la latencia total desde el momento de creación del archivo hasta el momento de la subida correcta.

/udca/server/upload_latencies dataset

Tiempo total, en segundos, que ha tardado UDCA en subir un archivo de datos.

Los contenedores serán de 100 ms, 250 ms, 500 ms, 1 s, 2 s, 4 s, 8 s, 16 s, 32 s y 64 s.

Las métricas mostrarán un histograma de la latencia total de subida, incluidas todas las llamadas upstream.

/udca/upstream/http_error_count service

dataset

response_code

El número total de errores HTTP que ha detectado UDCA. Esta métrica es útil para determinar qué parte de las dependencias externas de UDCA está fallando y por qué.

Estos errores pueden producirse en varios servicios (getDataLocation, Cloud storage y Token generator) y en varios conjuntos de datos (como api y trace) con varios códigos de respuesta.

/udca/upstream/http_latencies service

dataset

La latencia de subida de los servicios, en segundos.

Los contenedores serán de 100 ms, 250 ms, 500 ms, 1 s, 2 s, 4 s, 8 s, 16 s, 32 s y 64 s.

Histograma de la latencia de los servicios upstream.

/udca/upstream/uploaded_file_sizes dataset

Tamaño del archivo que se está subiendo a los servicios de Apigee, expresado en bytes.

Los segmentos serán de 1 KB, 10 KB, 100 KB, 1 MB, 10 MB, 100 MB y 1 GB.

Histograma del tamaño de los archivos por conjunto de datos, organización y entorno.

/udca/upstream/uploaded_file_count dataset Número de archivos que UDCA ha subido a los servicios de Apigee.

Ten en cuenta que:

  • El valor del conjunto de datos event debería seguir aumentando.
  • El valor del conjunto de datos api debería seguir aumentando si la organización o el entorno tienen un tráfico constante.
  • El valor del conjunto de datos trace debería aumentar cuando uses las herramientas de seguimiento de Apigee para depurar o inspeccionar tus solicitudes.
/udca/disk/used_bytes dataset

state

Espacio ocupado por los archivos de datos en el disco del pod de recogida de datos, en bytes.

Un aumento de este valor a lo largo del tiempo:

  • ready_to_upload implica que el agente se está quedando atrás.
  • failed significa que los archivos se están acumulando en el disco y no se están subiendo. Este valor se calcula cada 60 segundos.
/udca/server/pruned_file_count dataset

state

Número de archivos que se han eliminado porque su tiempo de vida (TTL) superaba un umbral establecido. El conjunto de datos puede incluir APIs, trazas y otros elementos, y el estado puede ser UPLOADED, FAILED o DISCARDED.
/udca/server/retry_cache_size dataset

Recuento del número de archivos, por conjunto de datos, que UDCA está intentando subir de nuevo.

Después de 3 intentos con cada archivo, UDCA mueve el archivo al subdirectorio /failed y lo elimina de esta caché. Si este valor aumenta con el tiempo, significa que la caché no se está borrando, lo que ocurre cuando los archivos se mueven al subdirectorio /failed después de 3 reintentos.

Métricas de Cassandra

El servicio Prometheus recoge y trata métricas (como se describe en Recogida de métricas) de Cassandra igual que lo hace con otros servicios híbridos.

En la siguiente tabla se describen las métricas y las etiquetas que usa Prometheus en los datos de métricas de Cassandra. Estas etiquetas se usan en las entradas de registro de métricas.

Nombre de la métrica (sin incluir el dominio) Etiqueta Uso
/cassandra/process_max_fds Número máximo de descriptores de archivos abiertos.
/cassandra/process_open_fds Descriptores de archivos abiertos.
/cassandra/jvm_memory_pool_bytes_max pool Uso máximo de memoria de la JVM para el grupo.
/cassandra/jvm_memory_pool_bytes_init pol Uso inicial de memoria de la JVM para el grupo.
/cassandra/jvm_memory_bytes_max area Uso máximo de memoria del montículo de la JVM.
/cassandra/process_cpu_seconds_total Tiempo de CPU de usuario y del sistema empleado en segundos.
/cassandra/jvm_memory_bytes_used area Uso de memoria de montículo de JVM.
/cassandra/compaction_pendingtasks unit Compresiones pendientes de las sstables de Cassandra. Consulta Compresión para obtener más información.
/cassandra/jvm_memory_bytes_init area Uso de memoria inicial del montículo de la JVM.
/cassandra/jvm_memory_pool_bytes_used pool Uso de memoria del grupo de JVM.
/cassandra/jvm_memory_pool_bytes_committed pool Uso de memoria asignada del grupo de JVM.
/cassandra/clientrequest_latency scope

unit

Latencia de solicitudes de lectura en el intervalo del percentil 75 en microsegundos.
/cassandra/jvm_memory_bytes_committed area Uso de memoria asignada del montículo de la JVM.