Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Dataflow est basé sur le projet Open Source Apache Beam. Vous pouvez utiliser le SDK Apache Beam pour créer des pipelines pour Dataflow.
Ce document répertorie certaines ressources pour vous familiariser avec la programmation Apache Beam.
Installer le SDK Apache Beam : explique comment installer le SDK Apache Beam pour exécuter vos pipelines sur le service Dataflow.
Guide de programmation Apache Beam : fournit des conseils sur l'utilisation des classes du SDK Apache Beam pour créer et tester votre pipeline.
Présentation d'Apache Beam : guide d'apprentissage que vous pouvez utiliser pour vous familiariser avec Apache Beam.
Les unités de formation sont accompagnées d'exemples de code que vous pouvez exécuter et modifier.
Apache Beam Playground : environnement interactif permettant de tester des transformations et des exemples Apache Beam sans avoir à installer Apache Beam dans votre environnement.
Sur le site Web d'Apache Beam, vous pouvez également trouver des informations sur la conception, la création et le test de votre pipeline :
Concevoir votre pipeline : cette documentation vous montre comment déterminer la structure de votre pipeline, comment choisir les transformations à appliquer à vos données et comment déterminer vos méthodes d'entrée et de sortie.
Créer votre pipeline : cette documentation explique comment utiliser les classes des SDK Apache Beam et les étapes nécessaires pour créer un pipeline.
Tester votre pipeline : présente les bonnes pratiques à adopter pour tester vos pipelines.
Vous pouvez utiliser les exemples suivants du dépôt GitHub Apache Beam pour commencer à créer un pipeline de streaming :
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/03/24 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/03/24 (UTC)."],[[["\u003cp\u003eDataflow utilizes the open-source Apache Beam project, allowing users to construct pipelines with the Apache Beam SDK.\u003c/p\u003e\n"],["\u003cp\u003eResources are provided for installing the Apache Beam SDK, guiding users on how to run their pipelines within the Dataflow service.\u003c/p\u003e\n"],["\u003cp\u003eThe Apache Beam website offers resources covering pipeline design, creation, and testing best practices, using the classes in the Apache Beam SDK.\u003c/p\u003e\n"],["\u003cp\u003eThe Apache Beam playground offers an interactive environment to try out the Apache Beam transforms without needing to install Apache Beam.\u003c/p\u003e\n"],["\u003cp\u003eExample streaming pipelines, including word extraction, word count, and wordcap, are available on the Apache Beam GitHub repository in Java, Python, and Go.\u003c/p\u003e\n"]]],[],null,["# Use Apache Beam to build pipelines\n\nDataflow is built on the open source\n[Apache Beam](https://beam.apache.org/) project. You can\nuse the Apache Beam SDK to build pipelines for Dataflow.\nThis document lists some resources for getting started with Apache Beam\nprogramming.\n\nGet started\n-----------\n\n- [Install the Apache Beam SDK](/dataflow/docs/guides/installing-beam-sdk):\n Shows how to install the Apache Beam SDK so that you can run your\n pipelines in Dataflow.\n\n- [Create a Java pipeline](/dataflow/docs/guides/create-pipeline-java): Shows\n how to create a pipeline with the Apache Beam Java SDK and run the\n pipeline in Dataflow.\n\n- [Create a Python pipeline](/dataflow/docs/guides/create-pipeline-python):\n Shows how to create a pipeline with the Apache Beam Python SDK and run the\n pipeline in Dataflow.\n\n- [Create a Go pipeline](/dataflow/docs/guides/create-pipeline-go): Shows\n how to create a pipeline with the Apache Beam Go SDK and run the pipeline\n in Dataflow.\n\nLearn Apache Beam\n-----------------\n\nYou can use the following pages on the Apache Beam website to learn about\nApache Beam programming.\n\n- [Apache Beam programming guide](https://beam.apache.org/documentation/programming-guide/):\n Provides guidance for using the Apache Beam SDK classes to build and test\n your pipeline.\n\n- [Tour of Apache Beam](https://tour.beam.apache.org/):\n A learning guide you can use to familiarize yourself with Apache Beam.\n Learning units are accompanied by code examples that you can run and modify.\n\n- [Apache Beam playground](https://play.beam.apache.org/):\n An interactive environment to try out Apache Beam transforms and examples\n without having to install Apache Beam in your environment.\n\n- [Create your pipeline](https://beam.apache.org/documentation/pipelines/create-your-pipeline/):\n Explains the mechanics of using the classes in the Apache Beam SDKs and\n the necessary steps needed to build a pipeline.\n\nDevelop pipelines\n-----------------\n\n- [Plan your pipeline](/dataflow/docs/guides/plan-pipelines): Learn how to plan\n your pipeline before you begin code development.\n\n- [Develop and test pipelines](/dataflow/docs/guides/plan-pipelines): Learn best\n practices for developing and testing your Dataflow pipeline.\n\n- [Streaming pipelines](/dataflow/docs/concepts/streaming-pipelines): Learn\n about important design considerations for streaming pipelines, including\n windows, triggers, and watermarks.\n\nCode examples\n-------------\n\nYou can use the following examples from the Apache Beam GitHub to start\nbuilding a streaming pipeline:\n\n- [Streaming word extraction](https://github.com/apache/beam/blob/master/examples/java/src/main/java/org/apache/beam/examples/complete/StreamingWordExtract.java) (Java)\n- [Streaming word count](https://github.com/apache/beam/blob/master/sdks/python/apache_beam/examples/streaming_wordcount.py) (Python), and\n- [`streaming_wordcap`](https://github.com/apache/beam/blob/master/sdks/go/examples/streaming_wordcap/wordcap.go) (Go).\n\nWhat's next\n-----------\n\n- [Deploy Dataflow pipelines](/dataflow/docs/guides/deploying-a-pipeline).\n- [Use the Dataflow job monitoring interface](/dataflow/docs/guides/monitoring-overview)."]]