Nota
L'accés a aquesta pàgina requereix autorització. Pots provar d'iniciar sessió o canviar de directori.
L'accés a aquesta pàgina requereix autorització. Pots provar de canviar directoris.
En esta página se explica el modelo de datos y las consideraciones que se usan en los ejemplos que muestran cómo crear una vista de métrica mediante SQL o la interfaz de usuario.
Introducción al conjunto de datos de ejemplo
Los ejemplos proporcionados en Uso de SQL para crear y administrar vistas de métricas y Crear una vista de métrica mediante la interfaz de usuario del Explorador de catálogos usan el conjunto de datos de TPC-H, que está disponible de forma predeterminada en conjuntos de datos del catálogo de Unity.
El conjunto de datos TPC-H es un conjunto de datos de pruebas comparativas estándar que se usa para evaluar los sistemas de soporte de decisión y el rendimiento de las consultas. Modela un negocio mayorista de la cadena de suministro y se estructura en torno a operaciones empresariales comunes, como pedidos, clientes, proveedores y piezas. Representa un entorno de ventas y distribución, donde los clientes realizan pedidos de piezas suministradas por varios proveedores en diferentes naciones y regiones.
El esquema tiene 8 tablas:
REGIONyNATION: estas tablas definen la ubicación.CUSTOMERySUPPLIER: en estas tablas se describen las entidades empresariales.PARTyPARTSUPP: estas tablas capturan la información del producto y la disponibilidad del proveedor.ORDERSyLINEITEM: estas tablas representan transacciones, con elementos de línea que detallan los productos dentro de los pedidos.
ERD del conjunto de datos deTPC-H
En el diagrama siguiente se explican las relaciones entre las tablas.
Leyenda:
- Los paréntesis que siguen a cada nombre de tabla contienen el prefijo de los nombres de columna para esa tabla;
- Las flechas apuntan en la dirección de las relaciones uno a varios entre tablas;
- El número o fórmula debajo de cada nombre de tabla representa la cardinalidad (número de filas) de la tabla. Algunos se factorizarán mediante SF, el factor de escala, para obtener el tamaño de la base de datos elegida. La cardinalidad de la tabla LINEITEM es aproximada (consulte la cláusula 4.2.5).
(fuente: TPC Benchmark H Standard Specification)
Definición de una vista de métricas
Puede definir una vista de métricas mediante SQL DDL o la interfaz de usuario del Explorador de catálogos. Como alternativa, Databricks Assistant puede ayudarle a empezar a crear la vista de métricas. A continuación, puede editar el DDL de SQL proporcionado o usar el editor de vistas de métricas en la interfaz de usuario para refinar la definición sugerida.
La vista de métrica definida para los ejemplos de esta sección está diseñada para que un analista de ventas o financieros supervise los indicadores clave de rendimiento (KPI) relacionados con los pedidos de la empresa. Puede ayudar a responder a preguntas como:
- ¿Cómo ha tendencia nuestro total de ingresos a lo largo del tiempo?
- ¿Cuál es el desglose actual de nuestros pedidos por estado (Abierto, Procesamiento, Cumplido)?
- ¿Qué prioridades de orden generan más ingresos?
- ¿Cuántos ingresos están actualmente 'en riesgo' o pendientes (es decir, de pedidos abiertos)?
- ¿Cuál es el promedio de ingresos generados por cliente único?
Los componentes necesarios se describen en la tabla siguiente:
| Componente | Campo o expresión de YAML | Significado empresarial |
|---|---|---|
| Tabla de origen | samples.tpch.orders |
Los datos sin procesar que contienen los registros de pedidos del cliente. |
| Filter | o_orderdate > '1990-01-01' |
Centra el análisis solo en los pedidos realizados después del 1 de enero de 1990, probablemente excluyendo los datos históricos o archivados. |
| Dimensión: Mes de pedido | (DATE_TRUNC('MONTH', o_orderdate)) |
Habilita el análisis de tendencias (mes a mes o año a lo largo del año), realizando un seguimiento de cómo cambia el rendimiento a lo largo del tiempo. |
| Dimensión: Estado del pedido |
CASE instrucción que traduce el estado a Open, Processingo Fulfilled |
Permite la segmentación por fase del ciclo de vida, útil para la administración del suministro y el trabajo pendiente. |
| Dimensión: Prioridad del orden |
SPLIT instrucción que da formato al orden de prioridad en forma de número |
Se utiliza para agrupar el rendimiento por la importancia estratégica o la urgencia del orden. |
| Medida: Recuento de pedidos | COUNT(1) |
Mide la actividad de ventas por volumen |
| Medida: Ingresos totales | SUM(o_totalprice) |
Valor bruto de ventas de todos los pedidos |
| Medida: Ingresos totales por cliente | SUM(o_totalprice) / COUNT(DISTINCT o_custkey) |
Métrica de valor de cliente útil para evaluar la calidad de las transacciones del cliente. |
| Medida: Ingresos totales para pedidos abiertos | SUM(o_totalprice) FILTER (WHERE o_orderstatus='O') |
El valor de los ingresos no devengados o la cartera de pedidos de ventas actual. Se usa para la previsión y la evaluación de riesgos. |
Preguntar al asistente de Databricks
Databricks Assistant puede ayudarle a empezar a definir una vista de métricas.
- Haga clic en el
El icono del asistente, que se encuentra en la esquina superior derecha del área de trabajo de Databricks, para abrir el asistente.
- Escriba una descripción de la vista de métrica que desea crear. El Asistente devuelve DDL de SQL que trata de coincidir con tu solicitud.
- Copie el código SQL proporcionado y péguelo en el editor de SQL. A continuación, haga clic en Ejecutar.
- Edite sql o abra el editor de vistas de métricas para realizar ajustes.
Creación de una nueva vista de métricas
Use uno de los ejemplos siguientes para crear una nueva vista de métricas: