I modelli e le funzionalitร di AI generativa di Google e dei partner su Vertex AI sono esposti come endpoint regionali specifici e un endpoint globale. Gli endpoint globali coprono il mondo intero e offrono disponibilitร e affidabilitร superiori rispetto alle singole regioni.
Tieni presente che gli endpoint del modello non garantiscono la disponibilitร della regione o l'elaborazione ML nella regione. Per informazioni sulla residenza dei dati, consulta Residenza dei dati.
Endpoint globale
Selezionare un endpoint globale per le richieste puรฒ migliorare la disponibilitร complessiva riducendo gli errori di esaurimento delle risorse (429). Non utilizzare l'endpoint globale se hai requisiti di elaborazione ML, perchรฉ non puoi controllare o sapere a quale regione vengono inviate le tue richieste di elaborazione ML quando viene effettuata una richiesta.
Modelli supportati
L'utilizzo dell'endpoint globale รจ supportato per i seguenti modelli Google:
- Anteprima delle immagini di Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- Gemini 2.5 Pro
- Gemini 2.5 Flash
- Gemini 2.0 Flash
- Gemini 2.0 Flash-Lite
Per saperne di piรน sui modelli partner, consulta Google Cloud posizioni degli endpoint del modello partner
Utilizzare l'endpoint globale
Per utilizzare l'endpoint globale, escludi la localitร dal nome dell'endpoint e
configura la localitร della risorsa su global
. Ad esempio, il seguente
รจ l'URL dell'endpoint globale:
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Per l'SDK Google Gen AI, crea un client che utilizzi la localitร global
:
client = genai.Client(
vertexai=True, project='PROJECT_ID', location='global'
)
Per SDK Vertex AI Python,
inizializza l'SDK utilizzando la localitร global
:
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project='PROJECT_ID', location='global')
Limitazioni
Le seguenti funzionalitร non sono disponibili quando utilizzi l'endpoint globale:
- Ottimizzazione
- Previsione batch
- Corpus di Retrieval-Augmented Generation (RAG) (le richieste RAG sono supportate)
L'utilizzo dell'endpoint globale con il throughput riservato รจ disponibile solo per i seguenti modelli:
Modello | Ultima versione del modello supportata |
---|---|
Anteprima delle immagini di Gemini 2.5 Flash (anteprima) | gemini-2.5-flash-image-preview |
Gemini 2.5 Flash-Lite | gemini-2.5-flash-lite |
Gemini 2.5 Pro | gemini-2.5-pro |
Gemini 2.5 Flash | gemini-2.5-flash |
Gemini 2.0 Flash | gemini-2.0-flash-001 |
Gemini 2.0 Flash-Lite | gemini-2.0-flash-lite-001 |
Posizioni degli endpoint dei modelli Google
Gli endpoint dei modelli Google per l'AI generativa su Vertex AI sono disponibili nelle seguenti regioni.
Stati Uniti
Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Carolina del Sud (us-east1) | Virginia del Nord (us-east4) | Oregon (us-west1) | |
---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|||||||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|||||||
Gemini Embeddings ( gemini-embedding-001 ) |
|||||||
Embeddings per il testo | |||||||
Incorporamenti per multimodale | |||||||
Imagen per la generazione di didascalie e VQA | |||||||
Imagen ( imagegeneration@002 ) |
|||||||
Imagen 2 ( imagegeneration@005 ) |
|||||||
Imagen 2 ( imagegeneration@006 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||||||
Modifica e personalizzazione di Imagen 3 ( imagen-3.0-capability-001 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||||||
Imagen 4
( imagen-4.0-generate-001 ) |
|||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||||||
Imagen 4 Ultra Generate sperimentale
( imagen-4.0-ultra-generate-001 ) |
|||||||
Veo 2
( veo-2.0-generate-001 ) |
|||||||
Veo 3
( veo-3.0-generate-001 ) |
|||||||
Veo 3 Fast
( veo-3.0-fast-generate-001 ) |
|||||||
Veo 3 (anteprima)
( veo-3.0-generate-preview ) |
|||||||
Veo 3 Fast (anteprima)
( veo-3.0-fast-generate-preview ) |
Canada
Montrรฉal (northamerica-northeast1) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
* |
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Embeddings per il testo | |
Incorporamenti per multimodale | |
Imagen per la generazione di didascalie e VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Modifica e personalizzazione di Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate sperimentale
( imagen-4.0-ultra-generate-001 ) |
Sud America
San Paolo, Brasile (southamerica-east1) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Embeddings per il testo | |
Incorporamenti per multimodale | |
Imagen per la generazione di didascalie e VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Modifica e personalizzazione di Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate sperimentale
( imagen-4.0-ultra-generate-001 ) |
Europa
Paesi Bassi (europe-west4) | Parigi, Francia (europe-west9) | Londra, Regno Unito (europe-west2) | Francoforte, Germania (europe-west3) | Belgio (europe-west1) | Zurigo, Svizzera (europe-west6) | Madrid, Spagna (europe-southwest1) | Milano, Italia (europe-west8) | Finlandia (europe-north1) | Varsavia, Polonia (europe-central2) | |
---|---|---|---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
+ | * | * | |||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
||||||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
||||||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
||||||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
||||||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
||||||||||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
||||||||||
Gemini Embeddings ( gemini-embedding-001 ) |
||||||||||
Embeddings per il testo | ||||||||||
Incorporamenti per multimodale | ||||||||||
Imagen per la generazione di didascalie e VQA | ||||||||||
Imagen ( imagegeneration@002 ) |
||||||||||
Imagen 2 ( imagegeneration@005 ) |
||||||||||
Imagen 2 ( imagegeneration@006 ) |
||||||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
||||||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
||||||||||
Modifica e personalizzazione di Imagen 3 ( imagen-3.0-capability-001 ) |
||||||||||
Imagen 3imagen-3.0-generate-002 |
||||||||||
Imagen 4
( imagen-4.0-generate-001 ) |
||||||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
||||||||||
Imagen 4 Ultra Generate sperimentale
( imagen-4.0-ultra-generate-001 ) |
Asia Pacifico
Tokyo, Giappone (asia-northeast1) | Sydney, Australia (australia-southeast1) | Singapore (asia-southeast1) | Seul, Corea (asia-northeast3) | Taiwan (asia-east1) | Hong Kong, Cina (asia-east2) | Mumbai, India (asia-south1) | |
---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
* | * | * | * | * | ||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|||||||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|||||||
Gemini Embeddings ( gemini-embedding-001 ) |
|||||||
Embeddings per il testo | |||||||
Incorporamenti per multimodale | |||||||
Imagen per la generazione di didascalie e VQA | |||||||
Imagen ( imagegeneration@002 ) |
|||||||
Imagen 2 ( imagegeneration@005 ) |
|||||||
Imagen 2 ( imagegeneration@006 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||||||
Modifica e personalizzazione di Imagen 3 ( imagen-3.0-capability-001 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||||||
Imagen 4
( imagen-4.0-generate-001 ) |
|||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||||||
Imagen 4 Ultra Generate sperimentale
( imagen-4.0-ultra-generate-001 ) |
Medio Oriente
Dammam, Arabia Saudita (me-central2) | Doha, Qatar (me-central1) | Tel Aviv, Israele (me-west1) | |
---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|||
Gemini Embeddings ( gemini-embedding-001 ) |
|||
Embeddings per il testo | |||
Incorporamenti per multimodale | |||
Imagen per la generazione di didascalie e VQA | |||
Imagen ( imagegeneration@002 ) |
|||
Imagen 2 ( imagegeneration@005 ) |
|||
Imagen 2 ( imagegeneration@006 ) |
|||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||
Modifica e personalizzazione di Imagen 3 ( imagen-3.0-capability-001 ) |
|||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||
Imagen 4
( imagen-4.0-generate-001 ) |
|||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||
Imagen 4 Ultra Generate sperimentale
( imagen-4.0-ultra-generate-001 ) |
Globale
Globale (globale) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Embeddings per il testo | |
Incorporamenti per multimodale | |
Imagen per la generazione di didascalie e VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Modifica e personalizzazione di Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate sperimentale
( imagen-4.0-ultra-generate-001 ) |
* La regione รจ disponibile solo quando utilizzi il throughput riservato di una singola zona
+ Il perfezionamento supervisionato non รจ supportato in questa regione.
Google Cloud posizioni degli endpoint del modello partner
Google gestisce le richieste provenienti dalla regione che hai specificato. Per alcuni modelli, Google offre anche un endpoint globale per migliorare la disponibilitร complessiva e ridurre i tassi di errore. L'endpoint globale puรฒ avere un insieme separato di quote rispetto all'endpoint regionale e non supporta i requisiti di residenza dei dati. Per saperne di piรน, consulta la sezione "Endpoint regionali e globali" in Modelli partner di Vertex AI per MaaS.
Gli endpoint dei modelli partner per l'AI generativa su Vertex AI sono disponibili nelle seguenti regioni:
Stati Uniti
Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Carolina del Sud (us-east1) | Virginia del Nord (us-east4) | Oregon (us-west1) | |
---|---|---|---|---|---|---|---|
Claude Opus 4.1 di Anthropic | |||||||
Claude Opus 4 di Anthropic | |||||||
Claude Sonnet 4 di Anthropic | |||||||
Claude 3.7 Sonnet di Anthropic | |||||||
Claude 3.5 Sonnet v2 di Anthropic (ritirato) | |||||||
Claude 3.5 Sonnet di Anthropic (ritirato) | |||||||
Claude 3.5 Haiku di Anthropic | |||||||
Claude 3 Haiku di Anthropic | |||||||
DeepSeek R1 (0528) | |||||||
Llama 4 Maverick 17B-128E (anteprima) | |||||||
Llama 4 Scout 17B-16E (anteprima) | |||||||
Llama 3.3 70B (anteprima) | |||||||
Llama 3.2 90B (anteprima) | |||||||
Llama 3.1 405B | |||||||
Llama 3.1 70B (anteprima) | |||||||
Llama 3.1 8B (anteprima) | |||||||
OCR Mistral (25/05) | |||||||
Mistral Small 3.1 (25/03) | |||||||
Mistral Large | |||||||
Codestral | |||||||
Jamba 1.5 Large (ritirato) | |||||||
Jamba 1.5 Mini (ritirato) |
Europa
Paesi Bassi (europe-west4) | Belgio (europe-west1) | ||
---|---|---|---|
Claude Opus 4.1 di Anthropic | |||
Claude Opus 4 di Anthropic | |||
Claude Sonnet 4 di Anthropic | |||
Claude 3.7 Sonnet di Anthropic | |||
Claude 3.5 Sonnet v2 di Anthropic (ritirato) | |||
Claude 3.5 Sonnet di Anthropic (ritirato) | |||
Claude 3.5 Haiku di Anthropic | |||
Claude 3 Haiku di Anthropic | |||
DeepSeek R1 (0528) | |||
Llama 4 Maverick 17B-128E (anteprima) | |||
Llama 4 Scout 17B-16E (anteprima) | |||
Llama 3.3 70B (anteprima) | |||
Llama 3.2 90B (anteprima) | |||
Llama 3.1 405B | |||
Llama 3.1 70B (anteprima) | |||
Llama 3.1 8B (anteprima) | |||
OCR Mistral (25/05) | |||
Mistral Small 3.1 (25/03) | |||
Mistral Large | |||
Codestral | |||
Jamba 1.5 Large (ritirato) | |||
Jamba 1.5 Mini (ritirato) |
Asia Pacifico
Singapore (asia-southeast1) | Taiwan (asia-east1) | |
---|---|---|
Claude Opus 4.1 di Anthropic | ||
Claude Opus 4 di Anthropic | ||
Claude Sonnet 4 di Anthropic | ||
Claude 3.7 Sonnet di Anthropic | ||
Claude 3.5 Sonnet v2 di Anthropic (ritirato) | ||
Claude 3.5 Sonnet di Anthropic (ritirato) | ||
Claude 3.5 Haiku di Anthropic | ||
Claude 3 Haiku di Anthropic | ||
DeepSeek R1 (0528) | ||
Llama 4 Maverick 17B-128E (anteprima) | ||
Llama 4 Scout 17B-16E (anteprima) | ||
Llama 3.3 70B (anteprima) | ||
Llama 3.2 90B (anteprima) | ||
Llama 3.1 405B | ||
Llama 3.1 70B (anteprima) | ||
Llama 3.1 8B (anteprima) | ||
OCR Mistral (25/05) | ||
Mistral Small 3.1 (25/03) | ||
Mistral Large | ||
Codestral | ||
Jamba 1.5 Large (ritirato) | ||
Jamba 1.5 Mini (ritirato) |
Globale
Globale (globale) | ||
---|---|---|
Claude Opus 4.1 di Anthropic | ||
Claude Opus 4 di Anthropic | ||
Claude Sonnet 4 di Anthropic | ||
Claude 3.7 Sonnet di Anthropic | ||
Claude 3.5 Sonnet v2 di Anthropic (ritirato) | ||
Claude 3.5 Sonnet di Anthropic (ritirato) | ||
Claude 3.5 Haiku di Anthropic | ||
Claude 3 Haiku di Anthropic | ||
DeepSeek R1 (0528) | ||
Llama 4 Maverick 17B-128E (anteprima) | ||
Llama 4 Scout 17B-16E (anteprima) | ||
Llama 3.3 70B (anteprima) | ||
Llama 3.2 90B (anteprima) | ||
Llama 3.1 405B | ||
Llama 3.1 70B (anteprima) | ||
Llama 3.1 8B (anteprima) | ||
OCR Mistral (25/05) | ||
Mistral Small 3.1 (25/03) | ||
Mistral Large | ||
Codestral | ||
Jamba 1.5 Large (ritirato) | ||
Jamba 1.5 Mini (ritirato) |
Passaggi successivi
- Per un tutorial sui blocchi note che illustra l'endpoint globale, consulta Introduzione all'endpoint globale Vertex AI.
- Scopri di piรน sulla residenza dei dati dell'AI generativa su Vertex AI.
- Scopri di piรน sulle regioni diGoogle Cloud .
- Scopri di piรน sui controlli di sicurezza per funzionalitร .
- Scopri di piรน sui modelli che forniscono il supporto dell'IA generativa su Vertex AI. Consulta il riferimento al modello di base di AI generativa.
- Scopri di piรน sulle localitร di Vertex AI.