Este artículo proporciona consejos e información detallada sobre la combinación de datos para ayudarte a entender cómo funciona y a resolver casos prácticos complejos. Para sacar el máximo partido a este artículo, debes conocer los conceptos básicos de la combinación de datos, que se explican en los demás artículos de este tema.
Las combinaciones deben contener solo un subconjunto de los datos disponibles
Te recomendamos que solo incluyas los campos específicos que quieras visualizar en los gráficos basados en una combinación. A continuación, te indicamos por qué es importante:
- Al combinar datos, se pueden crear conjuntos de datos muy grandes, lo que puede ralentizar el rendimiento y, posiblemente, aumentar los costes de las consultas en servicios de pago como BigQuery.
- Los gráficos basados en combinaciones calculan todas las filas de su combinación aunque no se estén usando.
- Por ejemplo, imaginemos que creas una combinación que contiene 10 campos. Luego defines un gráfico que solo usa uno de esos campos. Looker Studio calcula la combinación de 10 campos y luego, para crear el gráfico, consulta los datos de ese campo en el resultado de la combinación.
- La reagregación solo se produce si tu combinación contiene un subconjunto de los datos subyacentes.
Combinar métricas para volver a agregarlas
Las métricas que incluyas de la fuente de datos subyacente se convierten en cifras no agregadas en la combinación. Si la combinación no incluye el conjunto de campos completo de la fuente de datos subyacente, los números se reagregan basándose en los datos nuevos. Usar la combinación de datos de esta forma puede ser útil si necesitas aplicar una agregación diferente a un campo que ya esté agregado; por ejemplo, si quieres calcular un promedio de promedios.
Consulta más información en el artículo Combinar datos para volver a agregarlos.
Crear combinaciones a partir de una sola fuente de datos
Las combinaciones no tienen por qué usar fuentes de datos diferentes. También puede ser útil volver a agregar datos combinando varias tablas de la misma fuente de datos.
Por ejemplo, supongamos que tiene un conjunto de datos que contiene datos de población de los tres condados más poblados de los estados más poblados de EE. UU., como se muestra en la siguiente tabla:
Estado |
Condado |
Población (estimación del 2023) |
---|---|---|
California |
Condado de Los Ángeles |
10.014.009 |
California |
Condado de San Diego |
3.298.634 |
California |
Condado de Orange |
3.186.989 |
Texas |
Condado de Harris |
4.731.145 |
Texas |
Condado de Dallas |
2.613.539 |
Texas |
Condado de Tarrant |
2.110.640 |
Nueva York |
Condado de Kings (Brooklyn) |
2.736.074 |
Nueva York |
Condado de Queens |
2.405.464 |
Nueva York |
Condado de Bronx |
1.418.890 |
Quieres calcular el porcentaje de población de cada condado del estado, pero para ello necesitas tener la población total de cada estado en un campo independiente. En el conjunto de datos, esa métrica no está disponible, pero puede obtenerla combinando su fuente de datos de población consigo misma. Para ello, siga estos pasos:
- Crea una fuente de datos con tu conjunto de datos base.
- Añada a un informe un gráfico que use esa fuente de datos.
- Crea una combinación con dos tablas. Cada tabla usará la misma fuente de datos que ha creado en el paso 1.
- En la tabla 1, incluya los siguientes campos:
- Estado, Condado y Población.
- Cambia el nombre de Population por CountyPopulation.
- En la tabla 2, incluya solo el campo Población y cámbiele el nombre a PoblaciónEstado.
- En la tabla 1, incluya los siguientes campos:
- En la condición de unión, usa una unión Externa izquierda que vincule Estado de la tabla 1 con Estado de la tabla 2.
- Haz clic en Guardar.
- Para volver al editor de informes, haz clic en X.
A continuación, añade un gráfico (por ejemplo, una tabla) al informe y selecciona la combinación como fuente de datos del gráfico siguiendo estos pasos:
- Añade los campos Estado, Condado, Población del condado y Población del estado al gráfico.
- Para calcular el porcentaje de población de cada condado, añade un campo calculado al gráfico que utilice los datos agregados de nuevo:
- En el panel de propiedades, haga clic en Añadir métrica y, a continuación, en Añadir campo.
- Asigna un nombre al campo (por ejemplo, Porcentaje de la población del estado).
- En el cuadro Fórmula, introduce
(CountyPopulation / StatePopulation)*100
. - (Opcional) Define el Formato de visualización para mostrar los valores de porcentaje con un nivel específico (por ejemplo, Porcentaje (2) para dos decimales).
Cuando haya terminado, la tabla debería tener un aspecto similar a este:
Estado |
Condado |
CountyPopulation |
StatePopulation |
Porcentaje de la población del estado |
---|---|---|---|---|
California |
Condado de Los Ángeles |
10014009 |
16499632 |
60,69 |
Texas |
Condado de Harris |
4731145 |
9455324 |
50.04 |
California |
Condado de San Diego |
3298634 |
16499632 |
19,99 € |
California |
Condado de Orange |
3186989 |
16499632 |
19,32 |
Nueva York |
Condado de Kings (Brooklyn) |
2736074 |
6560428 |
41.71 |
Texas |
Condado de Dallas |
2613539 |
9455324 |
27,64 |
Nueva York |
Condado de Queens |
2405464 |
6560428 |
36,67 |
Texas |
Condado de Tarrant |
2110640 |
9455324 |
22.32 |
Nueva York |
Condado de Bronx |
1418890 |
6560428 |
21,63 |
Orden de las tablas en la combinación
Looker Studio evalúa las configuraciones de unión de la combinación por orden, empezando por la situada más a la izquierda. Acto seguido, los resultados de cada unión se aplican a la siguiente unión de la derecha. Por ejemplo, en una combinación de tres tablas, se evalúa la configuración de unión entre la tabla 1 (la situada más a la izquierda) y la tabla 2 (en el centro). A continuación, esos resultados se usan en la configuración de unión entre la tabla 2 y la tabla 3 (la situada más a la derecha).
Orden de las tablas en combinaciones creadas automáticamente
Al combinar una selección de gráficos, Looker Studio crea una tabla para cada gráfico y añade los campos del gráfico a la tabla correspondiente. El orden de las tablas en este tipo de combinación coincide con el orden en que seleccionas los gráficos: el primer gráfico seleccionado se convierte en la primera tabla (la situada más a la izquierda), el segundo gráfico se convierte en la segunda tabla y así sucesivamente.
Looker Studio también crea automáticamente una configuración de unión para cada tabla y usa el tipo de unión de la tabla situada más a la izquierda.
Si la configuración predeterminada no te parece adecuada o si no hay vinculaciones claras entre las tablas, puedes modificar la combinación para que se adapte a tus objetivos.
Las tablas se crean antes de la combinación
Los datos de cada tabla de una combinación se consultan antes de unirlos en la combinación final. Los periodos, los filtros y los campos calculados de una tabla se aplican a la consulta que genera la tabla antes de que se haga ninguna unión. Estos factores pueden afectar a los datos incluidos en las tablas de la combinación y cambiar el resultado de la combinación.
Las combinaciones pueden contener más filas que los datos originales
Es posible que en un gráfico combinado se muestren más datos que en los gráficos basados en cada una de las fuentes de datos que conforman la combinación. El resultado puede depender de tus datos y de la configuración de unión que elijas en tu combinación. Por ejemplo, una unión externa izquierda incluye todos los registros de la tabla de la izquierda, así como los de las tablas de la derecha que comparten los mismos valores en la condición de unión. Si se encuentran varias coincidencias en la condición de unión, pueden aparecer más filas en los datos combinados que en la fuente de datos del extremo izquierdo.
Combinaciones y periodos y filtros explícitos
Hay dos formas de limitar el número de filas de las combinaciones: usar un periodo o aplicar un filtro. Puedes limitar las filas en los gráficos basados en una combinación o en las tablas que componen una combinación. Puede resultarte útil distinguir entre datos previos a la combinación y posteriores a la combinación.
Si usas un periodo o un filtro en una tabla de una combinación, se aplicarán antes de que los datos se unan al resto de las tablas de la combinación. La consulta de unión no se aplica a las filas que no se incluyen en el periodo o en el filtro.
Cuando usas un periodo o un filtro en un gráfico basado en una combinación, los estás aplicando a los datos después de que se haya creado la combinación ("datos posteriores a la combinación").
Esta diferencia podría tener un impacto considerable en los resultados que observes en tus gráficos, en función de tus datos y de cómo hayas configurado la combinación.
Combinaciones y filtros heredados
Las combinaciones heredan los filtros a nivel de informe, página o grupo, siempre y cuando los filtros sean compatibles con los datos previos o posteriores a la combinación. Si el filtro es compatible con las fuentes de datos subyacentes que se usan en la combinación, entonces se aplica a los datos previos a la combinación. De lo contrario, el filtro se aplica a los datos posteriores a la combinación. Si el filtro no es compatible con los datos previos ni posteriores a la combinación, se ignorará.
Más información sobre la herencia de filtros
Cuando a un gráfico basado en una combinación se le aplica un filtro heredado, Looker Studio procesa los datos en cinco pasos:
(Pre-blend):
- Paso 1: Los datos se agrupan y se agregan en función de las dimensiones especificadas en el panel Combinar datos.
- Paso 2: Los filtros de dimensión heredados y los de métricas compatibles se aplican a las fuentes de datos incluidas en el panel Combinar datos.
(Combinación):
- Paso 3: Los datos se combinan usando la configuración de unión que se haya definido.
(Después de la mezcla):
- Paso 4: Los datos se agrupan y se agregan en función de las dimensiones del gráfico.
- Paso 5: Los filtros de métricas se aplican al gráfico siempre que sean compatibles con los datos combinados.