Consejos para combinar datos y conceptos avanzados

Este artículo proporciona consejos e información detallada sobre la combinación de datos para ayudarte a entender cómo funciona y a resolver casos prácticos complejos. Para sacar el máximo partido a este artículo, debes conocer los conceptos básicos de la combinación de datos, que se explican en los demás artículos de este tema.

Las combinaciones deben contener solo un subconjunto de los datos disponibles

Te recomendamos que solo incluyas los campos específicos que quieras visualizar en los gráficos basados en una combinación. A continuación, te indicamos por qué es importante:

  • Al combinar datos, se pueden crear conjuntos de datos muy grandes, lo que puede ralentizar el rendimiento y, posiblemente, aumentar los costes de las consultas en servicios de pago como BigQuery.
  • Los gráficos basados en combinaciones calculan todas las filas de su combinación aunque no se estén usando.
    • Por ejemplo, imaginemos que creas una combinación que contiene 10 campos. Luego defines un gráfico que solo usa uno de esos campos. Looker Studio calcula la combinación de 10 campos y luego, para crear el gráfico, consulta los datos de ese campo en el resultado de la combinación.
    • La reagregación solo se produce si tu combinación contiene un subconjunto de los datos subyacentes.

Combinar métricas para volver a agregarlas

Las métricas que incluyas de la fuente de datos subyacente se convierten en cifras no agregadas en la combinación. Si la combinación no incluye el conjunto de campos completo de la fuente de datos subyacente, los números se reagregan basándose en los datos nuevos. Usar la combinación de datos de esta forma puede ser útil si necesitas aplicar una agregación diferente a un campo que ya esté agregado; por ejemplo, si quieres calcular un promedio de promedios.

Consulta más información en el artículo Combinar datos para volver a agregarlos.

Crear combinaciones a partir de una sola fuente de datos

Las combinaciones no tienen por qué usar fuentes de datos diferentes. También puede ser útil volver a agregar datos combinando varias tablas de la misma fuente de datos.

Por ejemplo, supongamos que tiene un conjunto de datos que contiene datos de población de los tres condados más poblados de los estados más poblados de EE. UU., como se muestra en la siguiente tabla:

Estado

Condado

Población (estimación del 2023)

California

Condado de Los Ángeles

10.014.009

California

Condado de San Diego

3.298.634

California

Condado de Orange

3.186.989

Texas

Condado de Harris

4.731.145

Texas

Condado de Dallas

2.613.539

Texas

Condado de Tarrant

2.110.640

Nueva York

Condado de Kings (Brooklyn)

2.736.074

Nueva York

Condado de Queens

2.405.464

Nueva York

Condado de Bronx

1.418.890

Quieres calcular el porcentaje de población de cada condado del estado, pero para ello necesitas tener la población total de cada estado en un campo independiente. En el conjunto de datos, esa métrica no está disponible, pero puede obtenerla combinando su fuente de datos de población consigo misma. Para ello, siga estos pasos:

  1. Crea una fuente de datos con tu conjunto de datos base.
  2. Añada a un informe un gráfico que use esa fuente de datos.
  3. Crea una combinación con dos tablas. Cada tabla usará la misma fuente de datos que ha creado en el paso 1.
    1. En la tabla 1, incluya los siguientes campos:
      1. Estado, Condado y Población.
      2. Cambia el nombre de Population por CountyPopulation.
    2. En la tabla 2, incluya solo el campo Población y cámbiele el nombre a PoblaciónEstado.
  4. En la condición de unión, usa una unión Externa izquierda que vincule Estado de la tabla 1 con Estado de la tabla 2.
  5. Haz clic en Guardar.
  6. Para volver al editor de informes, haz clic en X.

A continuación, añade un gráfico (por ejemplo, una tabla) al informe y selecciona la combinación como fuente de datos del gráfico siguiendo estos pasos:

  1. Añade los campos Estado, Condado, Población del condado y Población del estado al gráfico.
  2. Para calcular el porcentaje de población de cada condado, añade un campo calculado al gráfico que utilice los datos agregados de nuevo:
    1. En el panel de propiedades, haga clic en Añadir métrica y, a continuación, en Añadir campo.
    2. Asigna un nombre al campo (por ejemplo, Porcentaje de la población del estado).
    3. En el cuadro Fórmula, introduce (CountyPopulation / StatePopulation)*100.
    4. (Opcional) Define el Formato de visualización para mostrar los valores de porcentaje con un nivel específico (por ejemplo, Porcentaje (2) para dos decimales).

Cuando haya terminado, la tabla debería tener un aspecto similar a este:

Estado

Condado

CountyPopulation

StatePopulation

Porcentaje de la población del estado

California

Condado de Los Ángeles

10014009

16499632

60,69

Texas

Condado de Harris

4731145

9455324

50.04

California

Condado de San Diego

3298634

16499632

19,99 €

California

Condado de Orange

3186989

16499632

19,32

Nueva York

Condado de Kings (Brooklyn)

2736074

6560428

41.71

Texas

Condado de Dallas

2613539

9455324

27,64

Nueva York

Condado de Queens

2405464

6560428

36,67

Texas

Condado de Tarrant

2110640

9455324

22.32

Nueva York

Condado de Bronx

1418890

6560428

21,63

Orden de las tablas en la combinación

Looker Studio evalúa las configuraciones de unión de la combinación por orden, empezando por la situada más a la izquierda. Acto seguido, los resultados de cada unión se aplican a la siguiente unión de la derecha. Por ejemplo, en una combinación de tres tablas, se evalúa la configuración de unión entre la tabla 1 (la situada más a la izquierda) y la tabla 2 (en el centro). A continuación, esos resultados se usan en la configuración de unión entre la tabla 2 y la tabla 3 (la situada más a la derecha).

Orden de las tablas en combinaciones creadas automáticamente

Al combinar una selección de gráficos, Looker Studio crea una tabla para cada gráfico y añade los campos del gráfico a la tabla correspondiente. El orden de las tablas en este tipo de combinación coincide con el orden en que seleccionas los gráficos: el primer gráfico seleccionado se convierte en la primera tabla (la situada más a la izquierda), el segundo gráfico se convierte en la segunda tabla y así sucesivamente.

Looker Studio también crea automáticamente una configuración de unión para cada tabla y usa el tipo de unión de la tabla situada más a la izquierda.

Si la configuración predeterminada no te parece adecuada o si no hay vinculaciones claras entre las tablas, puedes modificar la combinación para que se adapte a tus objetivos.

Las tablas se crean antes de la combinación

Los datos de cada tabla de una combinación se consultan antes de unirlos en la combinación final. Los periodos, los filtros y los campos calculados de una tabla se aplican a la consulta que genera la tabla antes de que se haga ninguna unión. Estos factores pueden afectar a los datos incluidos en las tablas de la combinación y cambiar el resultado de la combinación.

Las combinaciones pueden contener más filas que los datos originales

Es posible que en un gráfico combinado se muestren más datos que en los gráficos basados en cada una de las fuentes de datos que conforman la combinación. El resultado puede depender de tus datos y de la configuración de unión que elijas en tu combinación. Por ejemplo, una unión externa izquierda incluye todos los registros de la tabla de la izquierda, así como los de las tablas de la derecha que comparten los mismos valores en la condición de unión. Si se encuentran varias coincidencias en la condición de unión, pueden aparecer más filas en los datos combinados que en la fuente de datos del extremo izquierdo.

Combinaciones y periodos y filtros explícitos

Hay dos formas de limitar el número de filas de las combinaciones: usar un periodo o aplicar un filtro. Puedes limitar las filas en los gráficos basados en una combinación o en las tablas que componen una combinación. Puede resultarte útil distinguir entre datos previos a la combinación y posteriores a la combinación.

Si usas un periodo o un filtro en una tabla de una combinación, se aplicarán antes de que los datos se unan al resto de las tablas de la combinación. La consulta de unión no se aplica a las filas que no se incluyen en el periodo o en el filtro.

Cuando usas un periodo o un filtro en un gráfico basado en una combinación, los estás aplicando a los datos después de que se haya creado la combinación ("datos posteriores a la combinación").

Esta diferencia podría tener un impacto considerable en los resultados que observes en tus gráficos, en función de tus datos y de cómo hayas configurado la combinación.

Combinaciones y filtros heredados

Las combinaciones heredan los filtros a nivel de informe, página o grupo, siempre y cuando los filtros sean compatibles con los datos previos o posteriores a la combinación. Si el filtro es compatible con las fuentes de datos subyacentes que se usan en la combinación, entonces se aplica a los datos previos a la combinación. De lo contrario, el filtro se aplica a los datos posteriores a la combinación. Si el filtro no es compatible con los datos previos ni posteriores a la combinación, se ignorará.

Más información sobre la herencia de filtros

Cuando a un gráfico basado en una combinación se le aplica un filtro heredado, Looker Studio procesa los datos en cinco pasos:

(Pre-blend):

  • Paso 1: Los datos se agrupan y se agregan en función de las dimensiones especificadas en el panel Combinar datos.
  • Paso 2: Los filtros de dimensión heredados y los de métricas compatibles se aplican a las fuentes de datos incluidas en el panel Combinar datos.

(Combinación):

  • Paso 3: Los datos se combinan usando la configuración de unión que se haya definido.

(Después de la mezcla):

  • Paso 4: Los datos se agrupan y se agregan en función de las dimensiones del gráfico.
  • Paso 5: Los filtros de métricas se aplican al gráfico siempre que sean compatibles con los datos combinados.