Vertex AI ti consente di eseguire il machine learning con dati tabulari utilizzando processi e interfacce semplici. Puoi creare i seguenti tipi di modello per i tuoi problemi con i dati tabulari:
- I modelli di classificazione binaria prevedono un risultato binario (una delle due classi). Utilizza questo tipo di modello per le domande con risposta sì o no. Ad esempio, potresti voler creare un modello di classificazione binaria per prevedere se un cliente acquisterà un abbonamento. In genere, un problema di classificazione binaria richiede meno dati rispetto ad altri tipi di modelli.
- I modelli di classificazione multi-classe prevedono una classe tra tre o più classi discrete. Utilizza questo tipo di modello per la categorizzazione. Ad esempio, in qualità di rivenditore, potresti voler creare un modello di classificazione multiclasse per segmentare i clienti in diverse buyer persona.
- I modelli di regressione prevedono un valore continuo. Ad esempio, in qualità di rivenditore, potresti voler creare un modello di regressione per prevedere quanto spenderà un cliente il mese successivo.
- I modelli di previsione prevedono una sequenza di valori. Ad esempio, in qualità di rivenditore, potresti voler prevedere la domanda giornaliera dei tuoi prodotti per i prossimi tre mesi, in modo da poter fare scorta di inventari in anticipo.
Per un'introduzione al machine learning con dati tabulari, consulta Introduzione ai dati tabulari. Per ulteriori informazioni sulle soluzioni Vertex AI, consulta Soluzioni Vertex AI per la classificazione e la regressione e Soluzioni Vertex AI per la previsione.
Una nota sull'equità
Google si impegna a fare progressi nel seguire le pratiche di AI responsabile. A questo scopo, i nostri prodotti di ML, tra cui AutoML, sono progettati in base a principi fondamentali come l'equità e il machine learning incentrato sull'uomo. Per saperne di più sulle best practice per ridurre il bias durante la creazione del tuo sistema ML, consulta la Guida al machine learning inclusivo - AutoML.
Soluzioni Vertex AI per classificazione e regressione
Vertex AI offre le seguenti soluzioni per la classificazione e la regressione:
- Flusso di lavoro tabulare per AutoML end-to-end
- Workflow tabulare per TabNet
- Flusso di lavoro tabulare per Wide & Deep
- Classificazione e regressione con AutoML
Flusso di lavoro tabulare per AutoML end-to-end
Il flusso di lavoro tabulare per AutoML end-to-end è una pipeline AutoML completa per le attività di classificazione e regressione. È simile all'API AutoML, ma ti consente di scegliere cosa controllare e cosa automatizzare. Anziché avere controlli per l'intera pipeline, hai controlli per ogni passaggio della pipeline. Questi controlli della pipeline includono:
- Suddivisione dei dati
- Feature engineering
- Ricerca dell'architettura
- Addestramento del modello
- Combinazione di modelli
- Distillazione del modello
Vantaggi
- Supporta set di dati di grandi dimensioni di più TB e fino a 1000 colonne.
- Consente di migliorare la stabilità e ridurre i tempi di addestramento limitando lo spazio di ricerca dei tipi di architettura o saltando la ricerca dell'architettura.
- Consente di migliorare la velocità di addestramento selezionando manualmente l'hardware utilizzato per l'addestramento e la ricerca dell'architettura.
- Consente di ridurre le dimensioni del modello e migliorare la latenza con la distillazione o modificando le dimensioni dell'ensemble.
- Ogni componente AutoML può essere esaminato in una potente interfaccia grafica delle pipeline che consente di visualizzare le tabelle di dati trasformate, le architetture dei modelli valutate e molti altri dettagli.
- Ogni componente AutoML offre maggiore flessibilità e trasparenza, ad esempio la possibilità di personalizzare parametri, hardware, visualizzare lo stato del processo, i log e altro ancora.
Per saperne di più su Tabular Workflows, consulta Tabular Workflows su Vertex AI. Per saperne di più su Tabular Workflow per AutoML end-to-end, consulta Tabular Workflow per AutoML end-to-end.
Workflow tabulare per TabNet
Il workflow tabulare per TabNet è una pipeline che puoi utilizzare per addestrare modelli di classificazione o regressione. TabNet utilizza l'attenzione sequenziale per scegliere le caratteristiche alla base del ragionamento in ogni fase decisionale. Ciò favorisce l'interpretabilità e un apprendimento più efficiente, perché la capacità di apprendimento viene utilizzata per le funzionalità più importanti.
Vantaggi
- Seleziona automaticamente lo spazio di ricerca degli iperparametri appropriato in base alle dimensioni del set di dati, al tipo di inferenza e al budget di addestramento.
- Integrato con Vertex AI. Il modello addestrato è un modello Vertex AI. Puoi eseguire inferenze batch o eseguire immediatamente il deployment del modello per le inferenze online.
- Fornisce l'interpretabilità intrinseca del modello. Puoi ottenere informazioni sulle funzionalità utilizzate da TabNet per prendere la decisione.
- Supporta l'addestramento della GPU.
Per saperne di più su Tabular Workflows, consulta Tabular Workflows su Vertex AI. Per saperne di più sul flusso di lavoro tabulare per TabNet, consulta Flusso di lavoro tabulare per TabNet.
Flusso di lavoro tabulare per Wide & Deep
Il workflow tabulare per Wide & Deep è una pipeline che puoi utilizzare per addestrare modelli di classificazione o regressione. Wide & Deep addestra congiuntamente modelli lineari ampi e reti neurali profonde. Combina i vantaggi della memorizzazione e della generalizzazione. In alcuni esperimenti online, i risultati hanno mostrato che Wide & Deep ha aumentato in modo significativo le acquisizioni di applicazioni dello store Google rispetto ai modelli solo wide e solo deep.
Vantaggi
- Integrato con Vertex AI. Il modello addestrato è un modello Vertex AI. Puoi eseguire inferenze batch o eseguire immediatamente il deployment del modello per le inferenze online.
Per saperne di più su Tabular Workflows, consulta Tabular Workflows su Vertex AI. Per saperne di più sul flusso di lavoro tabulare per Wide & Deep, vedi Flusso di lavoro tabulare per Wide & Deep.
Classificazione e regressione con AutoML
Vertex AI offre pipeline integrate e completamente gestite per attività di classificazione o regressione end-to-end. Vertex AI cerca il set ottimale di iperparametri, addestra più modelli con più set di iperparametri e poi crea un unico modello finale da un insieme dei modelli migliori. Vertex AI considera le reti neurali e gli alberi potenziati per i tipi di modelli.
Vantaggi
- Facile da usare: Vertex AI sceglie il tipo di modello, i parametri del modello e l'hardware per te.
Per ulteriori informazioni, consulta la panoramica su classificazione e regressione.
Soluzioni Vertex AI per la previsione
Vertex AI offre le seguenti soluzioni per la previsione:
- Flusso di lavoro tabulare per la previsione
- Previsione con AutoML
- Previsione con ARIMA_PLUS di BigQuery ML
- Previsione con Prophet
Flusso di lavoro tabulare per la previsione
Il flusso di lavoro tabulare per la previsione è la pipeline completa per le attività di previsione. È simile all'API AutoML, ma ti consente di scegliere cosa controllare e cosa automatizzare. Anziché avere controlli per l'intera pipeline, hai controlli per ogni passaggio della pipeline. Questi controlli della pipeline includono:
- Suddivisione dei dati
- Feature engineering
- Ricerca dell'architettura
- Addestramento del modello
- Combinazione di modelli
Vantaggi
- Supporta set di dati di grandi dimensioni fino a 1 TB e con un massimo di 200 colonne.
- Ti consente di migliorare la stabilità e ridurre i tempi di addestramento limitando lo spazio di ricerca dei tipi di architettura o saltando la ricerca dell'architettura.
- Consente di migliorare la velocità di addestramento selezionando manualmente l'hardware utilizzato per l'addestramento e la ricerca dell'architettura.
- Consente di ridurre le dimensioni del modello e migliorare la latenza modificando le dimensioni dell'ensemble.
- Ogni componente può essere esaminato in una potente interfaccia grafica delle pipeline che consente di visualizzare le tabelle di dati trasformate, le architetture dei modelli valutate e molti altri dettagli.
- Ogni componente offre maggiore flessibilità e trasparenza, ad esempio la possibilità di personalizzare parametri e hardware, visualizzare lo stato del processo, i log e altro ancora.
Per saperne di più su Tabular Workflows, consulta Tabular Workflows su Vertex AI. Per saperne di più sul workflow tabulare per la previsione, consulta Workflow tabulare per la previsione.
Previsione con AutoML
Vertex AI offre una pipeline integrata e completamente gestita per attività di previsione end-to-end. Vertex AI cerca il set ottimale di iperparametri, addestra più modelli con più set di iperparametri e poi crea un unico modello finale da un insieme dei modelli migliori. Puoi scegliere tra Time series Dense Encoder (TiDE), Temporal Fusion Transformer (TFT), AutoML (L2L) e Seq2Seq+ per il metodo di addestramento del modello. Vertex AI considera solo le reti neurali per il tipo di modello.
Vantaggi
- Facile da usare: Vertex AI sceglie i parametri del modello e l'hardware per te.
Per ulteriori informazioni, consulta la sezione Panoramica delle previsioni.
Previsione con ARIMA_PLUS di BigQuery ML
ARIMA_PLUS di BigQuery ML è un modello di previsione univariato. In quanto modello statistico, è più veloce da addestrare rispetto a un modello basato su reti neurali. Ti consigliamo di addestrare un modello ARIMA_PLUS di BigQuery ML se devi eseguire molte iterazioni rapide di addestramento del modello o se hai bisogno di una baseline economica per misurare altri modelli.
Come Prophet, BigQuery ML ARIMA_PLUS tenta di scomporre ogni serie temporale in tendenze, stagioni e festività, producendo una previsione utilizzando l'aggregazione delle inferenze di questi modelli. Una delle tante differenze, tuttavia, è che BQML ARIMA+ utilizza ARIMA per modellare il componente di tendenza, mentre Prophet tenta di adattare una curva utilizzando un modello logistico o lineare a tratti.
Google Cloud offre una pipeline per l'addestramento di un modello BigQuery ML ARIMA_PLUS e una pipeline per ottenere inferenze batch da un modello BigQuery ML ARIMA_PLUS. Entrambe le pipeline sono istanze di Vertex AI Pipelines dei Google Cloud componenti della pipeline (GCPC).
Vantaggi
- Facile da usare: BigQuery sceglie i parametri del modello e l'hardware per te.
- Veloce: l'addestramento del modello fornisce una base di riferimento a basso costo con cui confrontare altri modelli.
Per ulteriori informazioni, consulta la sezione Previsione con ARIMA+.
Previsione con Prophet
Prophet è un modello di previsione gestito da Meta. Per i dettagli dell'algoritmo, consulta il documento Prophet e la documentazione per saperne di più sulla libreria.
Come ARIMA_PLUS di BigQuery ML, Prophet tenta di scomporre ogni serie temporale in tendenze, stagioni e festività, producendo una previsione utilizzando l'aggregazione delle inferenze di questi modelli. Una differenza importante, tuttavia, è che BQML ARIMA+ utilizza ARIMA per modellare la componente di tendenza, mentre Prophet tenta di adattare una curva utilizzando un modello logistico o lineare a tratti.
Google Cloud offre una pipeline per l'addestramento di un modello Prophet e una pipeline per ottenere inferenze batch da un modello Prophet. Entrambe le pipeline sono istanze di Vertex AI Pipelines dei Google Cloud componenti della pipeline (GCPC).
L'integrazione di Prophet con Vertex AI ti consente di:
- Utilizza le strategie di suddivisione dei dati e le strategie di finestra di Vertex AI.
- Leggi i dati dalle tabelle BigQuery o dai file CSV archiviati in Cloud Storage. Vertex AI prevede che ogni riga abbia lo stesso formato di Vertex AI Forecasting.
Sebbene Prophet sia un modello multivariato, Vertex AI supporta solo una versione univariata.
Vantaggi
- Flessibile: puoi migliorare la velocità di addestramento selezionando l'hardware utilizzato per l'addestramento
Per ulteriori informazioni, consulta la sezione Previsioni con Prophet.
Passaggi successivi
- Scopri di più sul machine learning con dati tabulari.
- Scopri di più sulla classificazione e sulla regressione con AutoML.
- Scopri di più sulla previsione con AutoML.
- Scopri di più sulle previsioni con Prophet.
- Scopri di più sulla previsione con ARIMA_PLUS di BigQuery ML.
- Scopri di più sui workflow tabellari.