Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Antes de comenzar a publicar atributos en línea con Vertex AI Feature Store, debes configurar tu fuente de datos de atributos en BigQuery de la siguiente manera:
Crea una tabla o vista de BigQuery con tus datos de atributos. Para cargar datos de componentes en una tabla o vista de BigQuery, puedes crear un conjunto de datos de BigQuery con los datos, crear una tabla de BigQuery y, luego, cargar los datos de componentes del conjunto de datos en la tabla.
Después de cargar los datos de atributos en la tabla o la
vista de BigQuery, debes hacer que esta fuente de datos esté disponible para
Vertex AI Feature Store para la entrega en línea. Existen dos maneras en las que puedes conectar la fuente de datos a recursos de entrega en línea, como tiendas en línea e instancias de vistas de atributos:
Registra la fuente de datos mediante la creación de grupos de funciones y atributos: Puedes asociar grupos de funciones y atributos con las instancias de vistas de atributos en tu almacén en línea. En este caso, puedes darles formato a tus datos como una serie temporal si incluyes la columna feature_timestamp.
Vertex AI Feature Store solo entrega los valores no nulos más recientes
para cada ID de entidad único, según la marca de tiempo del atributo. Para obtener información sobre cómo crear grupos de atributos, consulta Crea un grupo de atributos. Para obtener información sobre cómo crear atributos dentro de un grupo de atributos, consulta Crea un atributo.
Entregar atributos directamente desde la fuente de datos sin crear grupos de atributos y atributos: Puedes especificar el URI de la fuente de datos en la vista de atributos.
Ten en cuenta que, en este caso, no puedes dar formato a tus datos como una serie temporal ni incluir datos históricos en la fuente de BigQuery. Cada fila debe contener los valores de atributos más recientes correspondientes a un ID único. No se admiten varias ocurrencias del mismo ID de entidad en diferentes filas.
Dado que Vertex AI Feature Store te permite mantener los datos de atributos
en BigQuery y entrega atributos desde la fuente de datos de BigQuery, no es necesario importar ni copiar los atributos a un almacén
sin conexión.
Lineamientos para la preparación de fuentes de datos
Sigue estos lineamientos para comprender el esquema y las restricciones mientras preparas
la fuente de datos en BigQuery:
La fuente de datos debe contener las siguientes columnas:
Al menos una columna de ID de entidad con valores string. El tamaño de cada valor de esta columna debe ser inferior a 4 KB.
Si registras la fuente de datos con grupos de atributos y funciones, incluye
la columna feature_timestamp y da formato a los datos como una serie temporal.
La columna feature_timestamp contiene valores del tipo timestamp.
Durante la entrega en línea, Vertex AI Feature Store entrega los valores más recientes de un atributo que no sean nulos según esta marca de tiempo.
Si asocias directamente una fuente de datos de BigQuery con una vista de atributos, la columna feature_timestamp no es obligatoria. En esta situación, debes solo incluir los valores de atributos más recientes en la fuente de datos y Vertex AI Feature Store no busca la marca de tiempo.
Si deseas usar la administración de incorporaciones en una tienda en línea creada para la entrega en línea optimizada, la fuente de datos debe contener las siguientes columnas:
Una columna embedding que contiene matrices del tipo float.
Opcional: Una o más columnas de filtrado del tipo string o matriz string.
Opcional: Una columna de agrupamiento del tipo int.
Cada fila de la fuente de datos es un registro completo de los valores de atributos asociados con un ID de entidad. Si falta un valor de atributo en una de las columnas, se considera como valor nulo. Según cómo definas la vista de atributos,
hay dos formas en que Vertex AI Feature Store selecciona los
valores de atributos que entrega:
Si la vista de atributos se define en función de grupos de atributos y atributos, Vertex AI Feature Store entrega el valor de atributo más reciente que no sea nulo mediante la marca de tiempo del atributo. Por ejemplo, si el valor de un atributo particular correspondiente a la marca de tiempo más reciente es nulo, Vertex AI Feature Store entrega el valor más reciente que no sea nulo de los valores históricos del atributo.
Si la vista de atributos se define especificando directamente una fuente de datos de BigQuery, cada fila debe contener un valor único para una columna de ID de entidad. En este caso, Vertex AI Feature Store entrega todos los
valores de atributos de la fuente de datos asociada.
Cada columna de la tabla o de la vista de BigQuery representa un atributo.
Proporciona los valores de cada atributo en una columna independiente. Si asocias la fuente de datos con un grupo de atributos y sus características, se asocia cada columna con un atributo independiente.
Los tipos de datos admitidos para valores de atributos incluyen bool, int, float, string, timestamp, matrices de estos tipos de datos y bytes. Ten en cuenta que, durante la sincronización de datos, los valores de componentes de tipo timestamp se convierten a int64.
La fuente de datos debe estar ubicada en la misma región que la instancia de la tienda en línea o en una multirregión que incluya o que se superponga con la región de la tienda en línea. Por ejemplo, si la tienda en línea está en us-central, la fuente de BigQuery puede estar ubicada en us-central o en US.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2024-12-20 (UTC)"],[],[],null,["# Prepare data source\n\nBefore you can start serving features online using\nVertex AI Feature Store, you need to set up your feature data source in\nBigQuery, as follows:\n\n1. Create a BigQuery table or view using your feature data. To load\n feature data into a BigQuery table or view, you can create a\n BigQuery dataset using the data, create a BigQuery\n table, and then load the feature data from the dataset into the table.\n\n2. After you load the feature data into the BigQuery table or\n view, you need to make this data source available to\n Vertex AI Feature Store for online serving. There are two ways in\n which you can connect the data source to online serving resources, such as\n online stores and feature view instances:\n\n - **Register the data source by creating feature groups and features:**\n You can associate feature groups and features with feature view instances\n in your online store. You can format the data in either of the following ways:\n\n - Format your data as a time series by including a feature timestamp\n column. Vertex AI Feature Store serves only the latest\n feature values for each unique entity ID, based on the feature\n timestamp in this column.\n\n - Format the data without including a feature timestamp columns.\n Vertex AI Feature Store manages the timestamps and serves\n only the latest feature values for each unique entity ID.\n\n For information about how to create feature groups, see\n [Create a feature group](/vertex-ai/docs/featurestore/latest/create-featuregroup). For\n information about how to create features within a feature group, see\n [create a feature](/vertex-ai/docs/featurestore/latest/create-feature).\n - **Directly serve features from the data source without creating feature groups and features:**\n You can specify the URI of the data source in the feature view.\n Note that in this scenario, you can't format your data as a time series or\n include historical data in the BigQuery source. Each row must contain\n the latest feature values corresponding to a unique ID. Multiple occurrences\n of the same entity ID in different rows are not supported.\n\nSince Vertex AI Feature Store lets you maintain feature data\nin BigQuery and serves features from the BigQuery\ndata source, there's no need to import or copy the features to an offline\nstore.\n\nData source preparation guidelines\n----------------------------------\n\nFollow these guidelines to understand the schema and constraints while preparing\nthe data source in BigQuery:\n\n1. Include the following columns in the data source:\n\n - **Entity ID columns** : The data source must have at least one entity ID\n column with `string` or `int` values. The default name for this column is\n `entity_id`. You can optionally use a different name for this column. The\n size of each value in this column must be less than 4 KB.\n\n Note that you can also designate a feature record by constructing the entity\n ID using features from multiple columns. In this scenario, you can include\n multiple entity ID columns in the data source. The name of each entity ID\n column must be unique. If you register the data source by creating feature\n groups, set the entity ID columns for each feature group.\n Otherwise, if you directly associate the data source with a feature view,\n configure the feature views to specify the entity ID columns.\n\n Note that you can include multiple ID columns in a data source. In such a\n scenario, the name of each entity ID column must be unique. You can\n configure your feature groups or feature views to construct the entity ID\n using the values from each column for a feature record.\n - **Feature timestamp column** : Optional. If you register the data source\n using feature groups and features, and need to format the data as a time\n series, include a feature timestamp column. The timestamp column contains\n values of type `timestamp`. The default name for the timestamp column is\n `feature_timestamp`. If you want to use a different column name, use the\n `time_series` parameter to set the timestamp column for the feature group.\n\n If you don't specify a timestamp column to format your data as a time series,\n Vertex AI Feature Store manages the timestamps for the features\n and serves the latest feature values.\n\n If you directly associate a BigQuery data source with a feature\n view, the `feature_timestamp` column isn't required. In this scenario, you\n must include only the latest feature values in the data source and\n Vertex AI Feature Store doesn't look up the timestamp.\n - **Embedding and filtering columns**: Optional. If you want to use embedding\n management in an online store created for Optimized online serving, the\n data source must contain the following columns:\n\n - An `embedding` column containing arrays of type `float`.\n\n - Optional: One or more filtering columns of type `string` or `string` array.\n\n - Optional: A crowding column of type `int`.\n\n2. Each row in data source is a complete record of feature values associated\n with an entity ID. If a feature value is missing in one of the columns, then\n it's considered a null value.\n\n3. Each column of the BigQuery table or view represents a feature.\n Provide the values for each feature in a separate column. If you're associating\n the data source with a feature group and features, associate each column with a separate feature.\n\n4. Supported data types for feature values include `bool`, `int`, `float`,\n `string`, `timestamp`, arrays of these data types, and bytes. Note that during\n [data sync](/vertex-ai/docs/featurestore/latest/sync-data), feature values of type `timestamp` are converted to\n `int64`.\n\n5. The data source must be located in the same region as the online store\n instance, or in a multi-region that includes or overlaps with the region for the\n online store. For example, if the online store is in `us-central`, the\n BigQuery source might be located in `us-central` or `US`.\n\n6. [Sync the data in a feature view](/vertex-ai/docs/featurestore/latest/create-featureview#sync_featuredata)\n before online serving to ensure that you serve only the latest feature values.\n If you're using scheduled data sync, you might need to [manually sync the data\n in the feature view](/vertex-ai/docs/featurestore/latest/sync-data).\n However, if you're using continuous data sync with Optimized online serving,\n then you don't need to manually sync the data.\n\nWhat's next\n-----------\n\n- Learn how to create [feature groups](/vertex-ai/docs/featurestore/latest/create-featuregroup) and [features](/vertex-ai/docs/featurestore/latest/create-feature).\n\n- Learn how to [create a feature view](/vertex-ai/docs/featurestore/latest/create-featureview).\n\n- [Online serving types](/vertex-ai/docs/featurestore/latest/online-serving-types) in Vertex AI Feature Store."]]