Deployment ed endpoint

I modelli e le funzionalitร  di AI generativa di Google e dei partner su Vertex AI sono esposti come endpoint regionali specifici e un endpoint globale. Gli endpoint globali coprono il mondo intero e offrono disponibilitร  e affidabilitร  superiori rispetto alle singole regioni.

Tieni presente che gli endpoint del modello non garantiscono la disponibilitร  della regione o l'elaborazione ML nella regione. Per informazioni sulla residenza dei dati, consulta Residenza dei dati.

Endpoint globale

Selezionare un endpoint globale per le richieste puรฒ migliorare la disponibilitร  complessiva riducendo gli errori di esaurimento delle risorse (429). Non utilizzare l'endpoint globale se hai requisiti di elaborazione ML, perchรฉ non puoi controllare o sapere a quale regione vengono inviate le tue richieste di elaborazione ML quando viene effettuata una richiesta.

Modelli supportati

L'utilizzo dell'endpoint globale รจ supportato per i seguenti modelli Google:

Per saperne di piรน sui modelli partner, consulta Google Cloud posizioni degli endpoint del modello partner

Utilizzare l'endpoint globale

Per utilizzare l'endpoint globale, escludi la localitร  dal nome dell'endpoint e configura la localitร  della risorsa su global. Ad esempio, il seguente รจ l'URL dell'endpoint globale:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Per l'SDK Google Gen AI, crea un client che utilizzi la localitร  global:

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Per SDK Vertex AI Python, inizializza l'SDK utilizzando la localitร  global:

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitazioni

Le seguenti funzionalitร  non sono disponibili quando utilizzi l'endpoint globale:

  • Ottimizzazione
  • Previsione batch
  • Corpus di Retrieval-Augmented Generation (RAG) (le richieste RAG sono supportate)

L'utilizzo dell'endpoint globale con il throughput riservato รจ disponibile solo per i seguenti modelli:

Modello Ultima versione del modello supportata
Anteprima delle immagini di Gemini 2.5 Flash (anteprima) gemini-2.5-flash-image-preview
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Posizioni degli endpoint dei modelli Google

Gli endpoint dei modelli Google per l'AI generativa su Vertex AI sono disponibili nelle seguenti regioni.

Stati Uniti

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina del Sud (us-east1) Virginia del Nord (us-east4) Oregon (us-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings per il testo
Incorporamenti per multimodale
Imagen per la generazione di didascalie e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Modifica e personalizzazione di Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate sperimentale
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3 (anteprima)
(veo-3.0-generate-preview)
Veo 3 Fast (anteprima)
(veo-3.0-fast-generate-preview)

Canada

Montrรฉal (northamerica-northeast1)
Gemini 2.5 Flash
(gemini-2.5-flash)
*
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings per il testo
Incorporamenti per multimodale
Imagen per la generazione di didascalie e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Modifica e personalizzazione di Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate sperimentale
(imagen-4.0-ultra-generate-001)

Sud America

San Paolo, Brasile (southamerica-east1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings per il testo
Incorporamenti per multimodale
Imagen per la generazione di didascalie e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Modifica e personalizzazione di Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate sperimentale
(imagen-4.0-ultra-generate-001)

Europa

Paesi Bassi (europe-west4) Parigi, Francia (europe-west9) Londra, Regno Unito (europe-west2) Francoforte, Germania (europe-west3) Belgio (europe-west1) Zurigo, Svizzera (europe-west6) Madrid, Spagna (europe-southwest1) Milano, Italia (europe-west8) Finlandia (europe-north1) Varsavia, Polonia (europe-central2)
Gemini 2.5 Flash
(gemini-2.5-flash)
+ * *
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings per il testo
Incorporamenti per multimodale
Imagen per la generazione di didascalie e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Modifica e personalizzazione di Imagen 3
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate sperimentale
(imagen-4.0-ultra-generate-001)

Asia Pacifico

Tokyo, Giappone (asia-northeast1) Sydney, Australia (australia-southeast1) Singapore (asia-southeast1) Seul, Corea (asia-northeast3) Taiwan (asia-east1) Hong Kong, Cina (asia-east2) Mumbai, India (asia-south1)
Gemini 2.5 Flash
(gemini-2.5-flash)
* * * * *
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings per il testo
Incorporamenti per multimodale
Imagen per la generazione di didascalie e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Modifica e personalizzazione di Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate sperimentale
(imagen-4.0-ultra-generate-001)

Medio Oriente

Dammam, Arabia Saudita (me-central2) Doha, Qatar (me-central1) Tel Aviv, Israele (me-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings per il testo
Incorporamenti per multimodale
Imagen per la generazione di didascalie e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Modifica e personalizzazione di Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate sperimentale
(imagen-4.0-ultra-generate-001)

Globale

Globale (globale)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings per il testo
Incorporamenti per multimodale
Imagen per la generazione di didascalie e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Modifica e personalizzazione di Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate sperimentale
(imagen-4.0-ultra-generate-001)

* La regione รจ disponibile solo quando utilizzi il throughput riservato di una singola zona

+ Il perfezionamento supervisionato non รจ supportato in questa regione.

Google Cloud posizioni degli endpoint del modello partner

Google gestisce le richieste provenienti dalla regione che hai specificato. Per alcuni modelli, Google offre anche un endpoint globale per migliorare la disponibilitร  complessiva e ridurre i tassi di errore. L'endpoint globale puรฒ avere un insieme separato di quote rispetto all'endpoint regionale e non supporta i requisiti di residenza dei dati. Per saperne di piรน, consulta la sezione "Endpoint regionali e globali" in Modelli partner di Vertex AI per MaaS.

Gli endpoint dei modelli partner per l'AI generativa su Vertex AI sono disponibili nelle seguenti regioni:

Stati Uniti

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina del Sud (us-east1) Virginia del Nord (us-east4) Oregon (us-west1)
Claude Opus 4.1 di Anthropic
Claude Opus 4 di Anthropic
Claude Sonnet 4 di Anthropic
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Sonnet v2 di Anthropic (ritirato)
Claude 3.5 Sonnet di Anthropic (ritirato)
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (anteprima)
Llama 4 Scout 17B-16E (anteprima)
Llama 3.3 70B (anteprima)
Llama 3.2 90B (anteprima)
Llama 3.1 405B
Llama 3.1 70B (anteprima)
Llama 3.1 8B (anteprima)
OCR Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large
Codestral
Jamba 1.5 Large (ritirato)
Jamba 1.5 Mini (ritirato)

Europa

Paesi Bassi (europe-west4) Belgio (europe-west1)
Claude Opus 4.1 di Anthropic
Claude Opus 4 di Anthropic
Claude Sonnet 4 di Anthropic
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Sonnet v2 di Anthropic (ritirato)
Claude 3.5 Sonnet di Anthropic (ritirato)
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (anteprima)
Llama 4 Scout 17B-16E (anteprima)
Llama 3.3 70B (anteprima)
Llama 3.2 90B (anteprima)
Llama 3.1 405B
Llama 3.1 70B (anteprima)
Llama 3.1 8B (anteprima)
OCR Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large
Codestral
Jamba 1.5 Large (ritirato)
Jamba 1.5 Mini (ritirato)

Asia Pacifico

Singapore (asia-southeast1) Taiwan (asia-east1)
Claude Opus 4.1 di Anthropic
Claude Opus 4 di Anthropic
Claude Sonnet 4 di Anthropic
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Sonnet v2 di Anthropic (ritirato)
Claude 3.5 Sonnet di Anthropic (ritirato)
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (anteprima)
Llama 4 Scout 17B-16E (anteprima)
Llama 3.3 70B (anteprima)
Llama 3.2 90B (anteprima)
Llama 3.1 405B
Llama 3.1 70B (anteprima)
Llama 3.1 8B (anteprima)
OCR Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large
Codestral
Jamba 1.5 Large (ritirato)
Jamba 1.5 Mini (ritirato)

Globale

Globale (globale)
Claude Opus 4.1 di Anthropic
Claude Opus 4 di Anthropic
Claude Sonnet 4 di Anthropic
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Sonnet v2 di Anthropic (ritirato)
Claude 3.5 Sonnet di Anthropic (ritirato)
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (anteprima)
Llama 4 Scout 17B-16E (anteprima)
Llama 3.3 70B (anteprima)
Llama 3.2 90B (anteprima)
Llama 3.1 405B
Llama 3.1 70B (anteprima)
Llama 3.1 8B (anteprima)
OCR Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large
Codestral
Jamba 1.5 Large (ritirato)
Jamba 1.5 Mini (ritirato)

Passaggi successivi