Descripción general de las opciones de entrenamiento personalizado en Vertex AI

Compara el entrenamiento personalizado de Vertex AI y Ray en Vertex AI

Vertex AI ofrece dos opciones para el entrenamiento personalizado: el entrenamiento personalizado de Vertex AI y Ray en Vertex AI. En esta página, se proporciona contexto para ayudarte a elegir entre estas dos opciones.

Vertex AI Training Ray on Vertex AI
Enfoque Entrenamiento de modelos personalizados de uso general Escalar aplicaciones de IA y Python, incluido el entrenamiento de modelos, las aplicaciones distribuidas y la entrega de modelos
Framework subyacente Admite varios frameworks de AA, por ejemplo, TensorFlow, PyTorch y scikit-learn. Aprovecha el framework de código abierto Ray. Admite varios frameworks: TensorFlow, PyTorch, scikit-learn y Spark en Ray con RayDP.
Flexibilidad Alta flexibilidad en términos de código y entorno Alta flexibilidad para compilar aplicaciones distribuidas; se puede usar el código de Ray existente con cambios mínimos.
Escalabilidad Admite el entrenamiento distribuido en varias máquinas. Ofrece recursos de procesamiento escalables (CPU, GPU y TPU). Diseñado para una alta escalabilidad con las capacidades de procesamiento distribuido de Ray (hasta 2,000 nodos). Admite el ajuste de escala automático y manual.
Integración Se integra en otros servicios de Vertex AI (conjuntos de datos, Vertex AI Experiments y mucho más). Se integra en otros servicios Google Cloud como Vertex AI Inference y BigQuery.
Facilidad de uso Es más fácil de usar para los paradigmas de entrenamiento distribuido estándar. Se requiere familiaridad con los conceptos del framework de Ray.
Entorno Es un entorno administrado para ejecutar código de entrenamiento personalizado con contenedores compilados previamente o personalizados. Es un entorno administrado para ejecutar aplicaciones distribuidas con el framework de Ray, que simplifica la administración del clúster de Ray en Vertex AI.
Ajuste de hiperparámetros Incluye capacidades de ajuste de hiperparámetros. Simplifica el ajuste de hiperparámetros con herramientas para la optimización eficiente y la administración de experimentos.
Canalizaciones de entrenamiento Admite flujos de trabajo de AA complejos con varios pasos. No aplicable

Diferencias clave entre el entrenamiento personalizado de Vertex AI y Ray en Vertex AI

El entrenamiento personalizado de Vertex AI es un servicio más amplio que administra varios métodos de entrenamiento, mientras que Ray en Vertex AI usa específicamente el framework de procesamiento distribuido de Ray.

Vertex AI Training Ray on Vertex AI
Enfoque Se enfoca principalmente en el desarrollo y el entrenamiento de modelos. Administra varios métodos de entrenamiento. Diseñado para aplicaciones de Python distribuidas de uso general, incluido el procesamiento de datos, la entrega de modelos y el entrenamiento a gran escala.
Framework subyacente Se vincula a las capacidades distribuidas de frameworks de AA específicos (por ejemplo, TensorFlow, PyTorch). Usa Ray como el marco de trabajo central de procesamiento distribuido. Controla la distribución de tareas independientemente del framework de AA subyacente que se use en las tareas de Ray.
Configuración de recursos Configura recursos para trabajos de entrenamiento individuales. Administra clústeres de Ray en clústeres de Vertex AI. Ray controla la distribución de tareas dentro del clúster.
Configuración de la distribución Configura la cantidad y los tipos de réplicas para un trabajo de entrenamiento específico. Configura el tamaño y la composición del clúster de Ray en Vertex AI. El programador de Ray distribuye de forma dinámica las tareas y los actores entre los nodos disponibles.
Alcance de la distribución Por lo general, se enfoca en un solo trabajo de entrenamiento que puede ser de larga duración. Proporciona un entorno de procesamiento distribuido más persistente y de uso general en el que puedes ejecutar varias tareas y aplicaciones distribuidas durante el ciclo de vida del clúster de Ray.

Resumen

Si necesitas usar la potencia del procesamiento distribuido con el framework de Ray en el entorno de Google Cloud , Ray en Vertex AI es el servicio que debes usar. Ray en Vertex AI se puede considerar una herramienta específica dentro del ecosistema más grande de Vertex AI, especialmente útil para cargas de trabajo distribuidas y altamente escalables.

Si necesitas una plataforma administrada de uso más general para diversos enfoques de entrenamiento de modelos, incluidas las opciones automatizadas, la ejecución de código personalizado y el ajuste de hiperparámetros, los servicios de entrenamiento personalizado más amplios de Vertex AI son útiles.