Panoramica di Model Garden

Model Garden è una libreria di modelli AI/ML che ti aiuta a scoprire, testare, personalizzare ed eseguire il deployment di modelli e asset di Google e dei suoi partner.

Vantaggi di Model Garden

Quando lavori con i modelli di AI, Model Garden offre i seguenti vantaggi:

  • I modelli disponibili sono tutti raggruppati in un'unica posizione
  • Model Garden fornisce un pattern di deployment coerente per diversi tipi di modelli
  • Model Garden fornisce un'integrazione integrata con altre parti di Vertex AI, come l'ottimizzazione, la valutazione e la pubblicazione dei modelli
  • L'erogazione di modelli di AI generativa può essere difficile. Vertex AI gestisce il deployment e l'erogazione dei modelli per te

Esplorare i modelli

Per visualizzare l'elenco dei modelli Vertex AI e open source (di base, ottimizzabili e specifici per le attività), vai alla pagina Model Garden nella consoleGoogle Cloud .

Vai a Model Garden

Le categorie dei modelli disponibili in Model Garden sono:

Categoria Descrizione
Modelli di base Modelli di grandi dimensioni preaddestrati e multitasking che possono essere ottimizzati o personalizzati per attività specifiche utilizzando Vertex AI Studio, l'API Vertex AI e l'SDK Vertex AI per Python.
Modelli ottimizzabili Modelli che possono essere ottimizzati mediante una pipeline o un notebook personalizzati.
Soluzioni specifiche per le attività La maggior parte di questi modelli predefiniti può essere usata subito. Molti possono essere personalizzati usando i tuoi dati.

Per filtrare i modelli nel riquadro dei filtri, specifica quanto segue:

  • Attività: fai clic sull'attività che vuoi che il modello esegua.
  • Raccolte di modelli: fai clic per scegliere i modelli gestiti da Google, dai partner o da te.
  • Fornitori: fai clic sul fornitore del modello.
  • Funzionalità: fai clic sulle funzionalità che vuoi includere nel modello.

Per saperne di più su ciascun modello, fai clic sulla relativa scheda.

Per un elenco dei modelli disponibili in Model Garden, consulta Modelli disponibili in Model Garden.

Analisi della sicurezza del modello

Google esegue test e benchmark approfonditi sui container di serving e tuning che forniamo. La scansione attiva delle vulnerabilità viene applicata anche agli artefatti container.

I modelli di terze parti dei partner in evidenza vengono sottoposti a scansioni dei checkpoint del modello per garantirne l'autenticità. I modelli di terze parti di Hugging Face Hub vengono analizzati direttamente da Hugging Face e dal relativo scanner di terze parti per rilevare malware, file pickle, livelli Keras Lambda e segreti. I modelli ritenuti non sicuri da queste scansioni vengono segnalati da Hugging Face e il loro deployment in Model Garden viene bloccato. I modelli ritenuti sospetti o quelli che hanno la capacità di eseguire potenzialmente codice remoto sono indicati in Model Garden, ma possono comunque essere implementati. Ti consigliamo di eseguire una revisione approfondita di qualsiasi modello sospetto prima di eseguirne il deployment in Model Garden.

Prezzi

Per i modelli open source in Model Garden, ti viene addebitato l'utilizzo di quanto segue su Vertex AI:

Controllare l'accesso a modelli specifici

Puoi impostare un criterio dell'organizzazione Model Garden a livello di organizzazione, cartella o progetto per controllare l'accesso a modelli specifici in Model Garden. Ad esempio, puoi consentire l'accesso a modelli specifici che hai esaminato e negare l'accesso a tutti gli altri.

Scopri di più su Model Garden

Per saperne di più sulle opzioni di deployment e sulle personalizzazioni che puoi eseguire con i modelli in Model Garden, consulta le risorse nelle sezioni seguenti, che includono link a tutorial, riferimenti, blocchi note e video di YouTube.

Esegui il deployment e distribuisci

Scopri di più sulla personalizzazione delle implementazioni e sulle funzionalità avanzate di pubblicazione.

Conformità dei contenitori

Model Garden offre i seguenti container conformi a FedRAMP High per la pubblicazione dei modelli.

Nome del contenitore Attività supportate Versione dell'immagine container Esempio di notebook
PyTorch Inference v0.4 audio2text
text2image
zero-shot-image-classification
zero-shot-object-detection
csm_text2speech
dia_text2speech
image-to-text
visual-question-answering
instant-id
janus_text2image
janus_text_generation
mask-generation
nllb_translation
paligemma_v2
pix2pix
us-docker.pkg.dev/deeplearning-platform-release/vertex-model-garden/pytorch-inference.cu125.0-4.ubuntu2204.py310:model-garden.pytorch-inference-0-4-gpu-release_20250828.00_p0 HiDream-I1
SGLang Generazione di testo da testo us-docker.pkg.dev/deeplearning-platform-release/vertex-model-garden/sglang-serve.cu124.0-4.ubuntu2204.py310:model-garden.sglang-0-4-release_20250828.00_p0 Qwen3 (deployment)
HuggingFace Inference Toolkit Generazione di testo in immagine
Generazione di testo semplice
Classificazione del testo
Traduzione
Rilevamento di oggetti zero-shot
Generazione di maschere
Incorporamenti di frasi
Estrazione di funzionalità
Riempimento maschera

Elenco completo delle attività: https://huggingface.co/docs/inference-endpoints/en/supported_tasks
us-docker.pkg.dev/deeplearning-platform-release/vertex-model-garden/hf-inference-toolkit.cu125.0-1.ubuntu2204.py311:model-garden.hf-inference-toolkit-0-1-release_20250828.01_p0 Deployment di Hugging Face PyTorch Inference
HuggingFace Text Embeddings Inference (TEI) text2embeddings us-docker.pkg.dev/deeplearning-platform-release/vertex-model-garden/hf-tei.cu125.0-1.ubuntu2204.py310:model-garden.hf-tei-0-1-release_20250828.01_p0 Deployment dell'inferenza di Hugging Face Text Embeddings

Ottimizzazione

Scopri di più sull'ottimizzazione dei modelli per personalizzare le risposte per casi d'uso specifici.

Valutazione

Scopri di più sulla valutazione delle risposte del modello con Vertex AI

Risorse aggiuntive