Descripción general del Catálogo universal de Dataplex
Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Dataplex Universal Catalog es una solución de administración inteligente y unificada para los recursos de datos y de IA en Google Cloud. Con Dataplex Universal Catalog, puedes usar la IA para simplificar las consultas de datos, el control de calidad y las estadísticas empresariales.
Dataplex Universal Catalog realiza la administración a gran escala. Por ejemplo, considera una empresa minorista global que genera grandes cantidades de datos de ventas, inventario y clientes que se almacenan en Cloud Storage, Spanner y Pub/Sub. Con los datos distribuidos en varios sistemas, puede ser complejo y llevar mucho tiempo administrar la administración, garantizar la calidad y mantener el cumplimiento.
Dataplex Universal Catalog simplifica este proceso, ya que proporciona una vista central para descubrir, generar perfiles, validar, hacer un seguimiento del linaje y controlar el acceso a los recursos de datos de la organización.
¿Por qué usar Dataplex Universal Catalog?
Dataplex Universal Catalog administra los datos a través de las siguientes funciones:
Categorización de metadatos. Recupera metadatos para los recursos Google Cloud (en BigQuery, Cloud SQL, Spanner, Vertex AI, Pub/Sub, Dataform y Dataproc Metastore) y los recursos de terceros que incorporas a Dataplex Universal Catalog para obtener una instantánea de tus recursos de datos.
Descubrimiento de datos. Analiza los datos estructurados y no estructurados en los buckets de Cloud Storage para extraer y catalogar sus metadatos.
Estadísticas de datos. Usar la IA para generar preguntas en lenguaje natural sobre tus datos, descubrir patrones, evaluar la calidad de los datos y realizar análisis estadísticos
Creación de perfiles de datos. Identificar características comunes de los datos de las columnas en tus tablas de BigQuery, por ejemplo, valores de datos típicos, distribución de datos y recuentos de nulos, que pueden informar la clasificación de datos y el control de calidad
Calidad de los datos. Define y mide la calidad de los datos en tus tablas de BigQuery validando los datos según las políticas de la organización y registrando alertas si los datos no cumplen con los criterios de calidad.
Glosario empresarial. Administra la terminología y las definiciones relacionadas con la empresa en toda tu organización, y adjunta términos a las columnas de la tabla para promover una comprensión coherente del uso de los datos.
Linaje de datos. Hacer un seguimiento de cómo los datos se mueven a través de tus sistemas: de dónde provienen, a dónde se pasan y qué transformaciones se aplican a ellos
Dataplex Universal Catalog admite un ciclo de vida de los datos de extremo a extremo, desde el descubrimiento distribuido hasta las estadísticas empresariales. Las funciones de administración también están disponibles a través de BigQuery.
Casos de uso
Puedes usar Dataplex Universal Catalog para realizar las siguientes acciones:
Descubre y comprende tus datos. Dataplex Universal Catalog proporciona visibilidad sobre tus recursos de datos en toda la organización. Te permite encontrar recursos relevantes para las necesidades de consumo de datos. Proporciona contexto para los recursos de datos, lo que te ayuda a comprender la idoneidad de los recursos de datos para las necesidades de tu consumidor de datos.
Habilita la administración y el control de datos. Dataplex Universal Catalog proporciona metadatos que pueden informar y potenciar tus capacidades de administración y control de datos.
Mantén un repositorio extensible y completo para tus metadatos.
Dataplex Universal Catalog almacena y proporciona acceso a los metadatos que se recopilan automáticamente de tus recursos de Google Cloud . Puedes integrar tus propios metadatos desde sistemas que no sean deGoogle Cloud . Puedes enriquecer todos los metadatos con anotaciones adicionales de metadatos técnicos y comerciales.
Comenzar
Si es la primera vez que trabajas con Dataplex Universal Catalog, considera seguir una guía de inicio rápido:
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-04 (UTC)"],[[["\u003cp\u003eDataplex unifies distributed data across data lakes, warehouses, and marts without data movement, centralizing data management and governance.\u003c/p\u003e\n"],["\u003cp\u003eIt enables building a domain-specific data mesh across multiple Google Cloud projects while providing consistent data governance and monitoring.\u003c/p\u003e\n"],["\u003cp\u003eDataplex automates metadata discovery and curation across various data silos and offers secure querying using BigQuery and open-source tools.\u003c/p\u003e\n"],["\u003cp\u003eThe platform abstracts underlying data storage using constructs like lakes, zones, and assets to organize data based on business needs and data readiness.\u003c/p\u003e\n"],["\u003cp\u003eCommon use cases include creating a domain-centric data mesh with decentralized data ownership and tiering data based on its readiness for different users.\u003c/p\u003e\n"]]],[],null,["# Dataplex Universal Catalog overview\n\nDataplex Universal Catalog is a unified, intelligent governance solution for data and AI\nassets in Google Cloud. Through Dataplex Universal Catalog,\nyou can use AI to simplify data queries, quality assurance, and business\ninsights.\n\nDataplex Universal Catalog performs governance at scale. For example, consider a\nglobal retail company that generates large amounts of sales, inventory, and\ncustomer data that's stored in Cloud Storage, Spanner, and\nPub/Sub. With data distributed across systems, it can be complex and\ntime-consuming to manage governance, ensure quality, and maintain compliance.\nDataplex Universal Catalog simplifies this process by providing a central view to\ndiscover, profile, validate, track the lineage of, and control access to\norganizational data assets.\n\nWhy use Dataplex Universal Catalog?\n-----------------------------------\n\nDataplex Universal Catalog governs data through the following features:\n\n- **[Metadata cataloging](/dataplex/docs/catalog-overview)**. Retrieve metadata for Google Cloud resources (in BigQuery, Cloud SQL, Spanner, Vertex AI, Pub/Sub, Dataform, Dataproc Metastore), and third-party resources you bring into Dataplex Universal Catalog, for a snapshot of your data assets.\n- **[Data discovery](/bigquery/docs/automatic-discovery)**. Scan for structured and unstructured data in Cloud Storage buckets to extract and catalog their metadata.\n- **[Data insights](/dataplex/docs/data-insights)**. Use AI to generate natural language questions about your data, to uncover patterns, assess data quality, and perform statistical analyses.\n- **[Data profiling](/dataplex/docs/data-profiling-overview)**. Identify common characteristics of the column data in your BigQuery tables, for example, typical data values, data distribution, and null counts, which can inform data classification and quality assurance.\n- **[Data quality](/dataplex/docs/auto-data-quality-overview)**. Define and measure the quality of the data in your BigQuery tables, by validating data against organizational policies and logging alerts if data doesn't meet quality criteria.\n- **[Business glossary](/dataplex/docs/create-glossary)**. Manage business-related terminology and definitions across your organization, and attach terms to table columns to promote a consistent understanding of data usage.\n- **[Data lineage](/dataplex/docs/about-data-lineage)**. Track how data moves through your systems: where it comes from, where it is passed to, and what transformations are applied to it.\n\nDataplex Universal Catalog supports an end-to-end data lifecycle, from distributed\ndiscovery to business insights. Governance features are also available through\nBigQuery.\n\nUse cases\n---------\n\nYou can use Dataplex Universal Catalog to do the following:\n\n- **Discover and understand your data**. Dataplex Universal Catalog\n provides visibility over your data resources across the organization. It lets\n you find relevant resources for data consumption needs. It provides context\n for data resources, which helps you understand the suitability of data\n resources for your data consumer's needs.\n\n- **Enable data governance and data management**. Dataplex Universal Catalog\n supplies metadata that can inform and power your data governance and data\n management capabilities.\n\n- **Maintain an extensible and comprehensive repository for your metadata**.\n Dataplex Universal Catalog stores and provides access to metadata that\n is automatically harvested from your Google Cloud resources. You can\n integrate your own metadata from non-Google Cloud systems. You can enrich all\n metadata with additional business and technical metadata annotations.\n\nGet started\n-----------\n\nIf this is your first time working with Dataplex Universal Catalog, consider\nfollowing a quickstart:\n\n- [Track data lineage for a BigQuery table](/dataplex/docs/track-lineage-quickstart)\n\nWhat's next\n-----------\n\n- Learn about [metadata management in Dataplex Universal Catalog](/dataplex/docs/catalog-overview#catalog-model).\n- Learn how to [search for data assets](/dataplex/docs/search-assets).\n- Learn how to [manage entries and ingest custom sources](/dataplex/docs/ingest-custom-sources).\n- Learn how to [import metadata into Dataplex Universal Catalog](/dataplex/docs/managed-connectivity-overview).\n- Learn about [BigQuery governance](/bigquery/docs/data-governance)."]]