En el análisis de datos, conocer el esquema de una tabla es fundamental para comprender la estructura y el contenido de tus datos. En este artículo, te enseñaremos cómo consultar el esquema de datos de una tabla en BigQuery para obtener información detallada sobre las columnas, tipos de datos y otras propiedades esenciales de tus tablas.
Índice:
- ¿Qué es el esquema de datos de una tabla?
- ¿Cómo consultar el esquema (schema) de datos de una tabla?
- ¿Cómo consultar el Schema de una tabla con una consulta SQL?
¿Qué es el esquema de datos de una tabla?
El esquema de datos de una tabla de BigQuery es una descripción detallada de la estructura de una tabla.
Define el nombre de cada columna, el tipo de datos que almacena (por ejemplo, STRING, INTEGER, FLOAT, etc.), algunas propiedades adicionales como si la columna permite valores nulos (NULLABLE) o si puede contener múltiples valores (REPEATED) y la descripción de la variable.
En resumen, el esquema de datos es la columna vertebral de una tabla en BigQuery. Define cómo se organizan y almacenan los datos, lo que es fundamental para realizar análisis de datos efectivos.
Hay tablas que utilizaras de manera muy habitual por lo que conocerás el esquema de esa tabla hasta el ultimo detalle. Puede ser una tabla que hayas creado con datos internos que conoces bien o puede ser una tabla de un servicio, como pueda ser Google Analytics. Pero también puedes tener tablas en BigQuery que no conozcas en profundidad o que sean muchas tablas y no puedas saberte todas y cada una de las tablas y variables en ellas contenidas.
Conocer el esquema (schema) de una tabla, ya sea una creada por ti o una de un servicio como Google Analytics, es crucial para acceder y utilizar los datos de manera efectiva. Aunque domines algunas tablas, es común encontrar otras más complejas o numerosas que requieran un análisis más detallado.
¿Cómo consultar el esquema (schema) de datos de una tabla?
La primera opción es, como no, entrar en Bigquery y seleccionar en una tabla, y, a continuación, hacer clic en el esquema. De esta forma tienes una visual rápida de cual es el esquema de datos de la tabla y de como son los datos, e, incluso, la descripción de la variable.
Con este método, tendremos la información básica y servirá para muchas tablas. Pero cuando tengas un dataset en el que tengas varias tablas con un montón de variables en cada una y relacionadas entre si, no será útil para conocer su contenido.
¡¡¡Sí, Google Ads, lo digo por tí y por tus 127 tablas y más de 1.000 variables!!!
Al enfrentarnos a un caso como este, el enfoque debe de ser distinto. Tendremos que usar una consulta SQL para obtener el esquema.
¿Cómo consultar el Schema de una tabla con una consulta SQL?
Obtener el esquema de una tabla con una consulta SQL es más sencillo de lo que pueda parecer y es más potente de lo que imaginas. Una vez que tienes el esquema en una consulta puedes empezar a transformarla para que puedas obtener todo el detalle que contiene.
Empecemos con la consulta. En este caso, vamos a utilizar la tabla de costes que comenté en el post BigQuery: tres formas de calcular el coste, y aunque es una tabla sencilla, tiene todos los ingredientes para utilizar este método.
Para obtener el esquema de la tabla, abriremos una pestaña de consulta y copiaremos el siguiente código:
/*Consultar schema de tabla de BigQuery*/
SELECTDISTINCT *
FROM [PROJECT_ID.]DATASET_ID.INFORMATION_SCHEMA.TABLES WHERE TABLE_NAME LIKE "%cloud_pricing_export%"
Mediante esta consulta, obtendremos toda la información disponible sobre el esquema de datos de las tablas presentes en el dataset especificado, y al incluir la cláusula 'WHERE', filtramos únicamente la que nos interesa. De todo el resultado, la columna mas interesante es la que se llama 'ddl'.
Esta columna 'ddl' contiene la descripción de las variables de la tabla tal como la puedes ver en la interfaz de usuario, con su nombre de variable, tipo y descripción, pero en una consulta que te puedes exportar y trabajar para obtener el detalle del esquema en un formato más accesible.
A partir de aquí, tienes varias opciones para examinar el contenido: puedes continuar desarrollando el código para refinar el resultado o exportarlo para trabajarlo en una hoja de cálculo. La información será tuya y podrás utilizarla para comprender mejor el contenido de tus tablas.
Para obtener más detalles sobre lo que puedes hacer con el esquema de datos, consulta esta documentación de Google: Vista de TABLES | BigQuery | Google Cloud
David Hernández
Digital Analyst
Soy un apasionado de los datos, la tecnología, la ciencia y el aprendizaje continuo.
Trabajo como Digital Analyst desde 2020.
Participo en el ciclo completo de los datos: definición e implementación de recolección, procesado y distribución, análisis de datos y reporting.