Présentation des composants du pipeline Google Cloud
Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Le SDK des composants du pipeline Google Cloud (GCPC) fournit un ensemble de composants Kubeflow Pipelines prédéfinis, de qualité production, performants et faciles à utiliser. Vous pouvez utiliser les composants du pipeline Google Cloud pour définir et exécuter des pipelines de ML dans Vertex AI Pipelines et d'autres backends d'exécution de pipeline de ML conformes à Kubeflow Pipelines.
Par exemple, vous pouvez utiliser ces composants pour effectuer les opérations suivantes :
Créer un ensemble de données et y charger différents types de données (données d'image, données tabulaires, de texte ou de vidéos).
Exporter les données d'un ensemble de données vers Cloud Storage.
Utiliser AutoML pour entraîner un modèle à l'aide de données d'images, de données tabulaires, de texte ou de vidéos.
Exécutez une tâche d'entraînement personnalisé à l'aide d'un conteneur personnalisé ou d'un package Python.
Importer un modèle existant dans Vertex AI pour la prédiction par lot.
Créer un point de terminaison et y déployer un modèle pour les prédictions en ligne.
En outre, les composants du pipeline Google Cloud prédéfinis sont compatibles avec Vertex AI et offrent les avantages suivants :
Débogage plus simple : affichage des ressources sous-jacentes lancées à partir du composant pour un débogage simplifié.
Types d'artefacts standards : disponibilité d'interfaces cohérentes afin d'utiliser les types d'artefacts standards pour les entrées et les sorties. Ces artefacts standards sont suivis dans Vertex ML Metadata, ce qui facilite l'analyse de la traçabilité des artefacts de votre pipeline.
Pour en savoir plus sur la traçabilité des artefacts, consultez la section Suivre la traçabilité des artefacts de pipeline.
Comprendre les coûts des pipelines avec les étiquettes de facturation : les étiquettes de ressources sont automatiquement propagées aux services Google Cloud générés par les composants de pipeline Google Cloud dans votre exécution de pipeline. Vous pouvez utiliser les étiquettes de facturation conjointement avec l'exportation Cloud Billing vers BigQuery pour examiner le coût de votre exécution de pipeline. Pour plus d'informations sur l'utilisation des étiquettes afin de comprendre le coût d'une exécution de pipeline, consultez la section Comprendre les coûts d'exécution des pipelines. Pour en savoir plus sur la propagation des étiquettes d'une exécution de pipeline aux ressources générées par les composants de pipeline Google Cloud, consultez la section Étiquetage de ressources par Vertex AI Pipelines.
Rentabilité* : Vertex AI Pipelines optimise l'exécution de ces composants en lançant les ressources Google Cloud sans avoir à lancer le conteneur.
Cela réduit la latence de démarrage et les coûts du conteneur en attente.
*
Cette fonctionnalité ne s'applique qu'aux composants suivants :
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2024/11/22 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2024/11/22 (UTC)."],[],[],null,["# Introduction to Google Cloud Pipeline Components\n\nThe Google Cloud (GCPC) SDK provides a set of prebuilt\nKubeflow Pipelines components that are production quality,\nperformant, and easy to use. You can use Google Cloud Pipeline Components to define and run ML\npipelines in Vertex AI Pipelines and other\nML pipeline execution backends conformant with Kubeflow Pipelines.\n\nFor example, you can use these components to complete the following:\n\n- Create a new dataset and load different data types into the dataset (image, tabular, text, or video).\n- Export data from a dataset to Cloud Storage.\n- Use AutoML to train a model using image, tabular, or video data.\n- Run a custom training job using a custom container or a Python package.\n- Upload an existing model to Vertex AI for batch prediction.\n- Create a new endpoint and deploy a model to it for online predictions.\n\nAdditionally, Google Cloud Pipeline Components supports these prebuilt components\nin Vertex AI Pipelines and offers the following benefits:\n\n- **Easier debugging**: Show the underlying resources launched from the component for simplified debugging.\n- **Standardized artifact types** : Provide consistent interfaces to use [standard artifact types](/vertex-ai/docs/pipelines/artifact-types) for input and output. Vertex ML Metadata tracks these standard artifacts, making it easier for you to analyze the lineage of your pipeline's artifacts. For more details on artifact lineage, see [Tracking the lineage of pipeline\n artifacts](/vertex-ai/docs/pipelines/lineage).\n- **Understand pipeline costs with billing labels** : Resource labels automatically propagate to Google Cloud services generated by the Google Cloud Pipeline Components in your pipeline run. Use billing labels along with Cloud Billing export to BigQuery to review the cost of your pipeline run. For more information about using labels to understand the cost of a pipeline run, see [Understand pipeline run costs](/vertex-ai/docs/pipelines/understand-pipeline-cost-labels). For more information about how labels propagate from a pipeline run to resources spawned by Google Cloud Pipeline Components, see [Resource labeling by Vertex AI Pipelines](/vertex-ai/docs/pipelines/gcpc-label-propagation).\n- **Cost efficiencies** ^\\*^: Vertex AI Pipelines optimizes the execution of these components by launching the Google Cloud resources, without having to launch the container. This reduces the startup latency and reduces the costs of the busy-waiting container.\n\nWhat's next\n-----------\n\n- See all [tutorials that use the Google Cloud SDK](/vertex-ai/docs/pipelines/notebooks).\n- Learn more about specific [Google Cloud Pipeline Components in the reference section](/vertex-ai/docs/pipelines/gcpc-list).\n- Read the official [Google Cloud SDK reference](https://google-cloud-pipeline-components.readthedocs.io/en/google-cloud-pipeline-components-2.19.0/api/v1/index.html).\n- See the Google Cloud Pipeline Components section in the [Kubeflow Pipelines SDK repository](https://github.com/kubeflow/pipelines/tree/master/components/google-cloud)."]]