Observabilidad de GKE

Autopilot Estándar

En esta página, se describe cómo puedes comprender el estado de tus aplicaciones y mantener la disponibilidad y confiabilidad de estas.

Funciones de observabilidad predeterminadas

De forma predeterminada, los clústeres de GKE están configurados para hacer lo siguiente:

Enviar registros del sistema, registros de auditoría y registros de aplicaciones a Cloud Logging.
Enviar métricas del sistema a Cloud Monitoring.
Usar Google Cloud Managed Service para Prometheus para recopilar métricas configuradas de terceros y definidas por el usuario y, luego, enviarlas a Cloud Monitoring. Google Cloud Managed Service para Prometheus te permite supervisar y crear alertas en tus cargas de trabajo mediante Prometheus, sin administrar ni operar de forma manual Prometheus a gran escala.

Personaliza y mejora la recopilación de datos

De forma predeterminada, GKE crea un repositorio de Logging para almacenar registros de cada clúster. Puedes controlar qué registros y qué métricas, si las hay, se envían desde tu clúster de GKE a Cloud Logging y Cloud Monitoring.

También puedes controlar si habilitas Google Cloud Managed Service para Prometheus.

Para los clústeres de Autopilot de GKE, no puedes inhabilitar la integración de Cloud Monitoring y Cloud Logging.

Métricas de observabilidad adicionales

Puedes recopilar métricas de observabilidad adicionales si habilitas uno o más paquetes de métricas de observabilidad:

Métricas del plano de control: Supervisa el estado de los componentes de Kubernetes mediante la recopilación de métricas para el servidor de la API, Scheduler y el Administrador de controladores de Kubernetes. Estas métricas son indicadores útiles del estado del servicio para definir objetivos de nivel de servicio (SLO).
Kube State Metrics: supervisa el estado de los objetos de Kubernetes, como Deployments, nodos y Pods.
Métricas de cAdvisor/Kubelet: Supervisa el estado de los contenedores y el kubelet.

Si habilitaste GKE Enterprise en tu proyecto, estas métricas están habilitadas de forma predeterminada cuando te registras en una flota durante la creación del clúster.

Métricas definidas por el usuario y de terceros

Para supervisar las aplicaciones de terceros que se ejecutan en tus clústeres, como Postgres, MongoDB y Redis, usa exportadores de Prometheus con Google Cloud Managed Service para Prometheus.

También puedes escribir exportadores personalizados para supervisar otros indicadores de estado y rendimiento.

Usa los datos recopilados

Usa los datos que recopilas para analizar el estado de la aplicación, depurarla, solucionar problemas y realizar pruebas a medida que desarrollas, implementas y mantienes tus aplicaciones.

GKE proporciona funciones de observabilidad integradas para que puedas comenzar con rapidez:

Visualiza los datos recopilados para tus clústeres y cargas de trabajo en los paneles de observabilidad de GKE. Puedes personalizar los paneles proporcionados para los siguientes fines:
- Visualizar las métricas clave del clúster, como el uso de CPU, el uso de memoria y la cantidad de incidentes abiertos.
- Visualizar clústeres por su infraestructura, cargas de trabajo o Services.
- Inspeccionar espacios de nombres, nodos, cargas de trabajo, Services, Pods y contenedores.
- En el caso de los Pods y los contenedores, consultar las métricas como una función de tiempo y visualiza las entradas de registro.
También puedes crear tus propios paneles o importar paneles de Grafana para satisfacer tus necesidades.

Nota: Los paneles de GKE proporcionados solo muestran información para los clústeres de GKE que se ejecutan en Google Cloud. No muestran información para los clústeres de GKE que se ejecutan en cualquier otro lugar, por ejemplo, mediante servidores locales o de equipos físicos.
En la pestaña Observabilidad, puedes crear políticas de alertas recomendadas para que recibas notificaciones sobre los problemas. Para obtener más información sobre las alertas, consulta la Descripción general de alertas.
Crea SLOs para supervisar los objetivos de rendimiento del servicio mediante métricas de GKE recopiladas.
Usa las guías de GKE para solucionar problemas comunes, como Pods no programables y contenedores que fallan repetidamente después del reinicio.
Explora y analiza tus datos con herramientas como el Explorador de registros, el Explorador de métricas y Error Reporting.
Revisa los registros de auditoría de GKE que registran actividades y accesos administrativos como parte de los registros de auditoría de Cloud. La política de registro de auditoría determina qué eventos se registran y si una entrada de registro pertenece a un registro de actividad del administrador o a un registro de acceso a datos.

Otras funciones

GKE se integra en otros servicios de Google Cloud para ayudarte a supervisar y administrar tus clústeres y cargas de trabajo.

Usa el panel de postura de seguridad para identificar problemas de seguridad según nuestros estándares y prácticas recomendadas de la industria.
Consulta estadísticas y recomendaciones para optimizar tus clústeres.
Usa el registro de políticas de red para solucionar problemas con las políticas de red de Kubernetes. Si usas GKE Dataplane V2, el registro de políticas de red está integrado.

Precios

Los precios de la integración en Cloud Logging (incluidos los registros de auditoría de Cloud), Cloud Monitoring y el servicio administrado de Google Cloud para Prometheus se basan en la cantidad de registros y métricas recopilados. Consulta la página de Precios para obtener más detalles.

Las funciones que proporcionan otros servicios de Google Cloud enumeradas en Otras funciones tienen precios diferentes. Consulta la sección de precios de esas páginas de documentación para obtener más información.

¿Qué sigue?

Observa tus clústeres. Aprende a ver paneles, organizar la información del clúster y ver los detalles de las alertas.
Habilita el registro de auditoría detallado a nivel del SO en los nodos del clúster de GKE y cómo exportar registros a Cloud Logging.