Throughput riservato a una singola zona

Il throughput di cui è stato eseguito il provisioning in una singola zona ti consente di prenotare il throughput in regioni specifiche in cui è disponibile una sola zona. Questa opzione offre prestazioni prevedibili per i modelli Gemini nei casi d'uso in cui è richiesto l'elaborazione ML.

Per visualizzare l'elenco dei modelli e delle regioni supportati, consulta Deployment ed endpoint. Per l'elenco delle regioni e dei modelli che supportano l'elaborazione ML, consulta Elaborazione ML.

Funzionalità del throughput riservato a una sola zona

Questa sezione descrive le funzionalità chiave di Single Zone Provisioned Throughput:

  • Prezzi e unità sono coerenti con il throughput con provisioning standard: il throughput con provisioning a zona singola utilizza la stessa misura di throughput (GSU), prezzi e termini del throughput con provisioning standard.

  • Throughput di cui è stato eseguito il provisioning in una singola zona supporta l'elaborazione ML nella regione: tutte le richieste vengono elaborate nella regione acquistata, incluso il traffico che supera la quantità di throughput acquistata. Questo traffico viene fatturato alla tariffa pay-as-you-go utilizzando la capacità buffer nella regione.

  • Tu controlli gli eccessi: puoi controllare il traffico di overflow utilizzando le stesse intestazioni del throughput con provisioning standard.

  • Puoi monitorare il tuo ordine: puoi monitorare l'ordine di portata sottoposta a provisioning a zona singola utilizzando le funzionalità di monitoraggio della portata sottoposta a provisioning esistenti.

Limitazioni

Il throughput di cui è stato eseguito il provisioning in una singola zona presenta le seguenti limitazioni:

  • Il Throughput riservato a zona singola non è un Servizio coperto ed è escluso dall'accordo sul livello del servizio di Gemini Online Inference su Vertex AI.

  • Il throughput di cui è stato eseguito il provisioning per una singola zona non si integra con o non supporta le richieste batch o il fine tuning.

  • Nelle regioni senza elaborazione ML, la latenza per il throughput di cui è stato eseguito il provisioning di una singola zona potrebbe essere superiore a quella del throughput di cui è stato eseguito il provisioning standard o del pagamento a consumo.

Acquistare la velocità effettiva sottoposta a provisioning per una singola zona

Per assistenza con l'acquisto di Single Zone Provisioned Throughput, contatta il tuo rappresentante dell'account. Google Cloud

Passaggi successivi