Se vuoi acquistare il throughput di cui è stato eseguito il provisioning per una singola zona, contatta il tuo Google Cloud rappresentante dell'account per ricevere assistenza. Per saperne di più sul throughput con provisioning di una singola zona, consulta Throughput con provisioning di una singola zona.
Cosa considerare prima dell'acquisto
Per aiutarti a decidere se acquistare il throughput di cui è stato eseguito il provisioning, considera quanto segue:
Non puoi annullare l'ordine a metà del periodo di validità.
L'acquisto di Provisioned Throughput è un impegno, il che significa che non puoi annullare l'ordine a metà del periodo. Tuttavia, puoi aumentare il numero di GSU acquistate. Se acquisti per errore un impegno o se si verifica un problema con la configurazione, contatta il tuo Google Cloud rappresentante dell'account per ricevere assistenza.
Puoi rinnovare automaticamente l'abbonamento.
Quando invii l'ordine, puoi scegliere di rinnovare automaticamente l'abbonamento al termine del periodo di validità o di lasciarlo scadere. Puoi annullare la procedura di rinnovo automatico. Per annullare l'abbonamento prima del rinnovo automatico, annulla il rinnovo automatico 30 giorni prima dell'inizio del periodo successivo.
Puoi configurare gli abbonamenti mensili in modo che si rinnovino automaticamente ogni mese. I termini settimanali non supportano il rinnovo automatico.
Per saperne di più, consulta Modificare l'ordine di throughput riservato. Puoi anche contattare il tuo Google Cloud rappresentante dell'account per ricevere assistenza.
Puoi modificare il comportamento, il modello, la versione del modello o la regione del rinnovo automatico con preavviso.
Dopo aver scelto il progetto, la regione, il modello, la versione del modello e il comportamento di rinnovo automatico e dopo che l'ordine è stato approvato e attivato, il throughput riservato viene attivato, in base alla capacità disponibile. Puoi modificare il comportamento, il modello, la versione del modello o la regione del rinnovo automatico modificando l'ordine di Provisioned Throughput esistente utilizzando la console Google Cloud .
Tutte le modifiche vengono elaborate secondo il criterio del "best effort" e vengono in genere completate entro 10 giorni lavorativi dalla richiesta iniziale.
Le modifiche al modello sono limitate a un editore specifico. Ad esempio, puoi cambiare l'assegnazione del modello di Provisioned Throughput da Google Gemini 2.0 Pro a Google Gemini 2.0 Flash, ma non puoi passare da Google Gemini 2.0 Flash a Claude 3.5 Sonnet v2 di Anthropic.
Per impostazione predefinita, l'eccedenza viene fatturata in base al pagamento a consumo.
Se il throughput supera l'importo dell'ordine di throughput di cui hai eseguito il provisioning, le eccedenze vengono elaborate e fatturate in base al pagamento a consumo standard. Puoi controllare le eccedenze in base alle singole richieste. Per ulteriori informazioni, consulta la sezione Utilizzare il throughput di cui è stato eseguito il provisioning.
Per informazioni sui prezzi, consulta la sezione Throughput riservato.
Acquistare il throughput riservato per i modelli in anteprima
Puoi acquistare il throughput di cui è stato eseguito il provisioning per i modelli Google in anteprima, a condizione che non sia stata rilasciata una versione disponibile a livello generale del modello.
Se hai un ordine di throughput riservato attivo per un modello in anteprima e viene rilasciata una versione del modello disponibile a livello generale, puoi:
Sposta l'ordine nella versione del modello disponibile pubblicamente. Tieni presente che dopo aver spostato l'ordine sul modello disponibile a livello generale, non puoi tornare al modello di anteprima. Per ulteriori informazioni sulla modifica di un ordine, vedi Modificare l'ordine di throughput riservato.
In alternativa, continua a utilizzare il throughput riservato per la versione di anteprima di un modello finché la versione di anteprima è stabile. Per ulteriori informazioni sui modelli stabili e ritirati, vedi Versioni e ciclo di vita dei modelli.
Ruoli e autorizzazioni
Il seguente ruolo concede l'accesso completo per gestire il throughput riservato di Vertex AI:
roles/aiplatform.provisionedThroughputAdmin
: puoi accedere alle risorse di throughput riservato di Vertex AI.
Questo ruolo include le seguenti autorizzazioni:
Autorizzazioni | Descrizione |
---|---|
aiplatform.googleapis.com/provisionedThroughputs.create |
Invia un nuovo ordine di Provisioned Throughput. |
aiplatform.googleapis.com/provisionedThroughputs.get |
Visualizza un ordine di throughput riservato specifico. |
aiplatform.googleapis.com/provisionedThroughputs.list |
Visualizza tutti gli ordini di throughput riservato. |
aiplatform.googleapis.com/provisionedThroughputs.update |
Modifica un ordine di Provisioned Throughput. |
aiplatform.googleapis.com/provisionedThroughputs.cancel |
Annullare un ordine in attesa o un aggiornamento in attesa. |
Effettuare un ordine di throughput con provisioning standard
Alcune funzionalità di Imagen potrebbero non essere disponibili pubblicamente. Per saperne di più, consulta Funzionalità GA e anteprima con accesso limitato.
Prima di effettuare un ordine per utilizzare MedLM-large-1.5, contatta il tuo Google Cloud account representative per richiedere l'accesso.
Se prevedi che il QPM superi 30.000, per massimizzare l'ordine di throughput riservato, richiedi una modifica della quota per la quota di sistema Vertex AI predefinita utilizzando le seguenti informazioni:
- Servizio: l'API Vertex AI.
- Nome:
Online prediction requests per minute per region
- Tipo di servizio: una quota.
- Dimensioni: la regione in cui hai ordinato il Throughput riservato.
- Valore: questo è il limite di traffico di previsione online che hai scelto.
Gli ordini di throughput riservato vengono elaborati in base alle dimensioni dell'ordine e alla capacità disponibile. A seconda del numero di GSU richieste e della capacità disponibile, l'elaborazione dell'ordine potrebbe richiedere da pochi minuti a qualche settimana. Quando effettui un ordine di Provisioned Throughput, puoi utilizzare lo strumento di stima delle unità della scala di AI generativa per calcolare il numero di GSU che devi acquistare. Dopo aver esaminato la stima, puoi procedere con l'acquisto o modificare il numero di GSU da acquistare.
Segui questi passaggi per acquistare la capacità di trasmissione di cui è stato eseguito il provisioning standard. Per assistenza con l'acquisto di Single Zone Provisioned Throughput, contatta il tuo Google Cloud rappresentante dell'account.
Console
- Nella console Google Cloud , vai alla pagina Throughput di cui è stato eseguito il provisioning.
- Per avviare un nuovo ordine, fai clic su Nuovo ordine.
- Inserisci un nome ordine.
- Seleziona il modello.
- Seleziona la regione.
- Fai clic su Strumento di stima.
Nel riquadro Strumento per la stima di unità della scala di AI generativa, esegui i seguenti passaggi per stimare il numero di GSU di cui hai bisogno.
- Seleziona il modello.
In base al modello selezionato, inserisci i dettagli per stimare il numero di GSU necessarie. Per informazioni sugli incrementi minimi e di acquisto di GSU per ogni modello, consulta Modelli supportati. Per informazioni sulle funzionalità e sui limiti di input o output di un modello, consulta la documentazione del modello.
Per i modelli Gemini 2.5 Pro e Gemini 2.5 Flash, inserisci quanto segue:
- Query al secondo stimate che richiedono la verifica
- Token di testo di input per query
- Token immagine di input per query
- Token video di input per query
- Token audio di input per query
- Token di testo per risposta di output per query
- Token di testo per ragionamento di output per query
- Immagini di output per query (valido solo per l'anteprima di Gemini 2.5 Flash Image)
Per il modello Gemini 2.5 Flash con API Live, inserisci quanto segue:
- Query al secondo stimate che richiedono la verifica
- Token di input per query
- Token audio di input per query
- Token video di input per query
- Token di memoria di sessione di input per query
- Token di testo di output per query
- Token audio di output per query
Per il modello Gemini 2.5 Flash-Lite, inserisci quanto segue:
- Query al secondo stimate che richiedono la verifica
- Token di testo di input per query
- Token immagine di input per query
- Token video di input per query
- Token audio di input per query
- Token di testo per risposta di output per query
- Token di testo per ragionamento di output per query
Per i modelli Gemini 2.0 Flash e Gemini 2.0 Flash-Lite, inserisci quanto segue:
- Query al secondo stimate che richiedono la verifica
- Token di input per query
- Token immagine di input per query
- Token video di input per query
- Token audio di input per query
- Token di testo di output per query
Per i modelli Veo 3 e Veo 3 Fast, inserisci quanto segue:
- Query al secondo stimate che richiedono la verifica
- Secondi di video di output per query
- Secondi di video e audio di output per query
Per i modelli Imagen, inserisci quanto segue:
- Query al secondo
- Immagini di output per query
Nella sezione GSU e prezzi mensili stimati, esamina il numero stimato di GSU di cui hai bisogno e i prezzi.
Fai clic su Utilizza valore calcolato.
(Facoltativo) Modifica il Numero di unità della scala di AI generativa (GSU) al mese.
Seleziona il Termine. Tieni presente che le tariffe del periodo non sono annullabili per la durata del periodo e verranno addebitate a prescindere dall'uso effettivo o se il modello non è più disponibile. Google consiglia di modificare il modello assegnato prima della data di fine della disponibilità. Google non annullerà in modo proattivo il rinnovo automatico per i modelli non più disponibili.
Sono disponibili le seguenti opzioni:
- 1 settimana
- 1 mese
- 3 mesi
- 1 anno
(Facoltativo) Seleziona la data e l'ora di inizio del periodo (anteprima).
Puoi fornire una data e un'ora di inizio entro due settimane dalla data in cui effettui l'ordine. Se non specifichi una data e un'ora di inizio, l'ordine viene elaborato non appena la capacità è disponibile. Le date e gli orari di inizio richiesti vengono elaborati secondo il criterio del "best effort" e non è garantito che gli ordini vengano completati entro queste date fino a quando lo stato dell'ordine non viene impostato su Approvato.
Se la data di inizio richiesta è troppo vicina alla data corrente, l'ordine potrebbe essere approvato e attivato dopo la data di inizio richiesta. In questo caso, la data di fine viene modificata in base alla durata del periodo selezionato, a partire dalla data di attivazione. Per informazioni sull'annullamento di un ordine in attesa, vedi Modificare l'ordine di throughput riservato.
Nell'elenco Rinnovo, specifica se vuoi rinnovare automaticamente l'ordine al termine del periodo. Puoi specificare l'opzione di rinnovo solo se selezioni 1 mese, 3 mesi o 1 anno come durata.
Fai clic su Continua.
Nella sezione Conferma e invia, rivedi le stime del prezzo e del throughput per il tuo ordine. Leggi i termini elencati e collegati nel modulo.
Per finalizzare e inviare l'ordine, inserisci
CONFIRM
nel campo Conferma di acquisto e poi fai clic su Invia ordine.L'elaborazione di un ordine può richiedere da pochi minuti a qualche settimana, a seconda delle dimensioni dell'ordine e della capacità disponibile. Una volta elaborato l'ordine, il relativo stato nella console Google Cloud diventa Attivo. L'ordine ti viene addebitato solo dopo l'attivazione.
Modificare un ordine di throughput riservato standard
Questa tabella descrive come modificare gli ordini di Provisioned Throughput tramite la consoleGoogle Cloud in base allo stato dell'ordine e alle condizioni esistenti. La modifica degli ordini è una funzionalità di anteprima ed è disponibile solo per gli ordini online effettuati tramite la console. Per le modifiche agli ordini offline, contatta il tuo Google Cloud account representative per ricevere assistenza.
Inoltre, le modifiche apportate al modello o alla versione del modello quando utilizzi la console Google Cloud modificano l'ordine esistente mantenendo la stessa data di fine abbonamento.
Stato dell'ordine | Azione | Nota | Passaggi nella Google Cloud console |
---|---|---|---|
In attesa di revisione | Puoi annullare l'ordine. |
Se devi apportare ulteriori modifiche all'ordine, annulla l'ordine in attesa ed effettua un nuovo ordine. Se hai più modelli, ogni modello può avere una sola revisione dell'ordine o un solo ordine in attesa alla volta. |
Per annullare l'ordine in attesa nella console Google Cloud , procedi nel seguente modo:
|
Approvato | Non puoi modificare l'ordine. | L'ordine è in attesa di attivazione. Al momento non puoi apportare modifiche all'ordine. | Non applicabile |
Attivo |
Puoi apportare le seguenti modifiche solo se l'ordine non scade nei cinque giorni successivi o si rinnova automaticamente:
|
Non puoi modificare un ordine attivo se scade in meno di cinque giorni e non è configurato per il rinnovo automatico. | Per modificare l'ordine attivo nella console Google Cloud , utilizza uno dei seguenti metodi:
|
Verifica lo stato dell'ordine
Dopo aver inviato l'ordine di Provisioned Throughput, lo stato dell'ordine potrebbe essere uno dei seguenti:
- In attesa di revisione: hai effettuato l'ordine. Poiché l'approvazione dipende dalla capacità disponibile per il provisioning dell'ordine, quest'ultimo è in attesa di revisione e approvazione. Per ulteriori informazioni sullo stato dell'ordine in attesa, contatta il rappresentante dell'account. Google Cloud
- Approvato: Google ha approvato l'ordine, che è in attesa di attivazione. Non puoi apportare modifiche dopo l'approvazione dell'ordine.
- Attivo: Google ha attivato l'ordine e la fatturazione ha inizio.
- Scaduto: il tuo ordine è scaduto.
Visualizzare gli ordini di throughput con provisioning standard
Per visualizzare gli ordini di Provisioned Throughput:
Console
- Nella console Google Cloud , vai alla pagina Provisioned Throughput (Throughput di cui è stato eseguito il provisioning).
- Seleziona la regione. Viene visualizzato l'elenco degli ordini.