Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Le débit provisionné à zone unique vous permet de réserver du débit dans des régions spécifiques où une seule zone est disponible. Cette option offre des performances prévisibles pour les modèles Gemini dans les cas d'utilisation où un traitement de ML est requis.
Pour afficher la liste des modèles et des régions compatibles, consultez Déploiements et points de terminaison. Pour obtenir la liste des régions et des modèles compatibles avec le traitement ML, consultez Traitement ML.
Caractéristiques du débit provisionné à zone unique
Cette section décrit les principales caractéristiques du débit provisionné à zone unique :
Les tarifs et les unités sont les mêmes que pour le débit provisionné standard :
Le débit provisionné à zone unique utilise la même mesure de débit (GSU), les mêmes tarifs et les mêmes conditions que le débit provisionné standard.
Le débit provisionné à zone unique est compatible avec le traitement ML dans la région : toutes les requêtes sont traitées dans la région achetée, y compris le trafic qui dépasse la quantité de débit achetée. Ce trafic est facturé au tarif du paiement à l'utilisation à l'aide de la capacité tampon de la région.
Vous contrôlez les dépassements : vous pouvez contrôler le trafic excédentaire à l'aide des mêmes en-têtes qu'avec le débit provisionné standard.
Vous pouvez surveiller votre commande : vous pouvez surveiller votre commande de débit provisionné dans une seule zone à l'aide des fonctionnalités de surveillance du débit provisionné existantes.
Limites
Le débit provisionné à zone unique présente les limites suivantes :
Dans les régions sans traitement ML, la latence du débit provisionné à zone unique peut être supérieure à celle du débit provisionné standard ou du paiement à l'usage.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/02 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/02 (UTC)."],[],[],null,["# Single Zone Provisioned Throughput lets you reserve\nthroughput in specific regions where only one [zone](/docs/geography-and-regions) is\navailable. This option provides\npredictable performance for Gemini models in use cases where ML\nprocessing is required.\n\nTo view the list of supported models and regions, see\n[Deployments and endpoints](/vertex-ai/generative-ai/docs/learn/locations). For the list of\nregions and models that support ML processing, see\n[ML processing](/vertex-ai/generative-ai/docs/learn/locations#canada).\n\nFeatures of Single Zone Provisioned Throughput\n----------------------------------------------\n\nThis section outlines the key features of Single Zone Provisioned Throughput:\n\n- **Pricing and units are consistent with standard Provisioned Throughput** :\n Single Zone Provisioned Throughput uses the same measure of throughput ([GSUs](/vertex-ai/generative-ai/docs/provisioned-throughput/measure-provisioned-throughput#gsu-burndown-rate)),\n [pricing](/vertex-ai/generative-ai/pricing#provisioned-throughput), and terms as\n standard [Provisioned Throughput](/vertex-ai/generative-ai/docs/provisioned-throughput/purchase-provisioned-throughput).\n\n- **Single Zone Provisioned Throughput supports in-region ML processing** : All requests are processed in the\n purchased region, including traffic that exceeds your purchased amount of\n throughput. This traffic is billed at the\n [pay-as-you-go rate](/vertex-ai/generative-ai/pricing#provisioned-throughput)\n using buffer capacity in the region.\n\n- **You control the overages** : You can\n [control overflow traffic](/vertex-ai/generative-ai/docs/provisioned-throughput/use-provisioned-throughput#use-rest-api)\n using the same headers as with standard Provisioned Throughput.\n\n- **You can monitor your order** : You can monitor your Single Zone Provisioned Throughput order using the existing\n [Provisioned Throughput monitoring](/vertex-ai/generative-ai/docs/provisioned-throughput/use-provisioned-throughput#monitor_provisioned_throughput) capabilities.\n\nLimitations\n-----------\n\nSingle Zone Provisioned Throughput has the following limitations:\n\n- Single Zone Provisioned Throughput is not a Covered Service and is excluded from the\n [Gemini Online Inference on Vertex AI Service Level Agreement](/vertex-ai/generative-ai/sla).\n\n- Single Zone Provisioned Throughput does not integrate with or support\n [Batch requests](/vertex-ai/generative-ai/docs/multimodal/batch-prediction-gemini#batch_prediction_use_case)\n or [Fine Tuning](/vertex-ai/generative-ai/docs/models/tune-models).\n\n- In regions without ML processing, latency for Single Zone Provisioned Throughput might be higher than\n standard Provisioned Throughput or pay-as-you-go.\n\nPurchase Single Zone Provisioned Throughput\n-------------------------------------------\n\nFor assistance with purchasing Single Zone Provisioned Throughput, [contact your Google Cloud account representative](/contact).\n\nWhat's next\n-----------\n\n- [Purchase standard Provisioned Throughput.](/vertex-ai/generative-ai/docs/purchase-provisioned-throughput)"]]