Comparteix via


Creación de un almacén de conocimiento para espacios de Genie más confiables

El almacén de conocimiento de Genie le permite organizar y mejorar el espacio a través de metadatos localizados, muestreo de valores e instrucciones sql estructuradas. Estas características ayudan a Genie a comprender los datos y a generar respuestas más precisas y relevantes.

¿Qué es un almacén de conocimiento?

Un almacén de conocimiento es una colección de definiciones semánticas mantenidas que mejora la comprensión de los datos de Genie y mejora la precisión de la respuesta.

El almacén de conocimiento consta de:

  • Personalización de metadatos de nivel de espacio: descripciones específicas del espacio para tablas, columnas y términos y sinónimos empresariales
  • Personalización de datos de nivel de espacio: conjuntos de datos simplificados y centrados sin cambiar las tablas subyacentes del catálogo de Unity
  • Muestreo de valores: ejemplos de datos reales que ayudan a Genie a comprender los tipos de datos y hacer coincidir las indicaciones del usuario con los valores reales
  • Relaciones de combinación: relaciones de tabla definidas para instrucciones precisas JOIN
  • Expresiones SQL: definiciones estructuradas de medidas, filtros y dimensiones que capturan lógica de negocios

Todas las configuraciones del almacén de conocimiento se limitan al espacio de Genie y no afectan a los metadatos de Unity Catalog ni a otros recursos de Azure Databricks.

Administración de metadatos del almacén de conocimiento

Enseñar a Genie sobre los datos en su espacio proporcionando descripciones de tablas y columnas locales y agregando sinónimos de columna que correspondan con términos empresariales comunes. Simplifique los conjuntos de datos ocultando columnas innecesarias o duplicadas para mantener el foco de Genie.

Estas prácticas mejoran la facilidad de uso para los usuarios que no tienen permisos directos en las tablas subyacentes y también admiten iteraciones más rápidas al actualizar versiones de instrucción.

Para acceder a los metadatos de nivel de espacio, haga clic en Configurar > datos en el espacio de Genie. A continuación, haga clic en un nombre de tabla para ver sus metadatos y columnas.

Ver columnas

Haga clic en un nombre de tabla para ver información general sobre los nombres y detalles de las columnas. En el ejemplo siguiente se muestra un ejemplo de una tabla denominada accounts.

Información general de la tabla que muestra la descripción de los metadatos y los detalles de las columnas, como se describe a continuación.

  • Descripción: Genie usa metadatos para comprender los datos y generar respuestas precisas. La descripción de la tabla predeterminada muestra los metadatos del catálogo de Unity asociados al recurso de datos. Puede editar esta descripción para agregar instrucciones específicas que ayuden a Genie a generar SQL para su espacio. Haga clic en Restablecer para restaurar la descripción del catálogo de Unity.

  • Columnas: Los nombres de columna y las descripciones se incluyen en la lista de columnas. Cada columna se etiqueta con etiquetas que muestran si incluye valores de ejemplo o un diccionario de valores. Consulte Información general sobre el muestreo de valores.

Ocultar o mostrar columnas pertinentes

Las columnas se pueden administrar individualmente o de forma masiva. Use las instrucciones siguientes para ocultar o mostrar columnas.

  • Ocultar una sola columna: haga clic en el icono Ojo situado junto al nombre de la columna.
  • Ocultar varias columnas:
    • Active las casillas de las columnas que desea ocultar.
    • En el menú Acciones , seleccione Ocultar columnas seleccionadas.
  • Deshacer cambios: repita los mismos pasos para mostrar una columna que estaba oculta.

Edición de metadatos de columna

Puede personalizar lo siguiente para cada columna:

  • Descripción: descripciones de columnas específicas del espacio que mejoran la comprensión de Genie.
  • Sinónimos: términos empresariales y palabras clave que ayudan a hacer coincidir el idioma del usuario con los nombres de columna.
  • Configuración avanzada: controles de muestreo de valores.
    • Valores de ejemplo: active o desactive el muestreo automático de valores representativos.
    • Crear diccionario de valores: habilite o deshabilite diccionarios de valores para columnas categóricas.

Para editar metadatos de columna:

  1. Haga clic en el icono lápiz. Icono de lápiz situado junto a un nombre de columna.
  2. Edite la descripción y los sinónimos de la columna.
  3. Si es necesario, haga clic en Configuración avanzada para abrir controles de muestreo de valores.
  4. Haga clic en Guardar para mantener los cambios y cerrar el cuadro de diálogo.

Información general sobre el muestreo de valores

El muestreo de valores mejora la capacidad de Genie para comprender y trabajar con los datos reales mediante la recopilación de ejemplos representativos.

El muestreo de valores mejora la generación de SQL de Genie al proporcionar acceso a valores de datos reales. Cuando los usuarios formulan preguntas conversacionales con errores ortográficos o terminología diferente, el muestreo de valores ayuda a Genie a emparejar las consultas con los valores de datos reales de tus tablas.

Componentes de muestreo de valores

  • Valores de ejemplo: ejemplos pequeños de cada columna que ayudan a Genie a comprender los tipos de datos y el formato. Se recopilan automáticamente para todas las columnas aptas.
  • Diccionarios de valores: listas seleccionadas de hasta 1024 valores distintos por columna (menos de 127 caracteres cada uno). Creado para hasta 120 columnas que contienen valores de cadena con formato categórico o coherente, como estados, categorías de producto o códigos de estado.

Las tablas con filtros de fila o máscaras de columna se excluyen del muestreo de valores.

Administración del muestreo de valores

Controlar qué columnas proporcionan valores de ejemplo y diccionarios de valores para optimizar la comprensión de los datos de Genie. El muestreo de valores está habilitado de forma predeterminada para todos los espacios de Genie.

Administración de valores de ejemplo

Los valores de ejemplo se agregan automáticamente al agregar tablas a un espacio de Genie.

Para desactivar los valores de ejemplo de una columna:

  1. Haga clic en Configurar > Datos en el espacio de Genie.
  2. Haga clic en un nombre de tabla para ver sus columnas.
  3. Haga clic en el icono lápiz. Icono de lápiz situado junto al nombre de la columna.
  4. Haz clic en Avanzado.
  5. Desactive Valores de ejemplo .

Esta acción deshabilita automáticamente la creación de un diccionario de valores para esa columna. Si es necesario, use esta configuración para volver a activar los valores de ejemplo .

Configuración de diccionarios de valores

Genie selecciona automáticamente las columnas para el muestreo de valores al agregar datos a un espacio. Puede administrar manualmente qué columnas tienen habilitados los diccionarios de valores. Elija columnas de cadena con valores de categorías o estructurados para obtener los mejores resultados. Evite columnas de texto libre como identificadores de usuario, nombres o revisiones de usuario.

Genie impide habilitar diccionarios de valores en tablas con filtros de fila o máscaras de columna. Sin embargo, los autores de espacios deben deshabilitar los diccionarios de valores para las vistas que hacen referencia a tablas con filtros de fila o máscaras de columna, o para vistas dinámicas.

En la lista siguiente se incluyen ejemplos de los tipos de datos que funcionan bien con diccionarios de valores:

  • Códigos de estado o país
  • Categorías de productos
  • Códigos de estado
  • Nombres de departamento

Para habilitar un diccionario de valores:

  1. Haga clic en el icono lápiz. Icono de lápiz situado junto al nombre de la columna.
  2. Haz clic en Avanzado.
  3. Active el Crear diccionario de valores.

Columna de cadena con el botón de diccionario de valores a la derecha.

Actualizar valores de ejemplo

Al actualizar los valores de ejemplo, se vuelven a sondear los datos y se recopilan nuevos valores para los ejemplos, así como para los diccionarios de valores.

Debe actualizar los valores de ejemplo en los casos siguientes:

  • Se han agregado nuevos valores a la columna
  • El formato de los valores existentes ha cambiado

Para actualizar los valores almacenados:

  1. Haga clic en el icono de menú Kebab. Menú kebab en la vista de columnas.
  2. Seleccione Actualizar valores de ejemplo.

Actualizar valores o quitar opciones de valores en la interfaz de usuario

Definir relaciones de unión

Ayuda a Genie a crear declaraciones precisas JOIN definiendo relaciones de tabla.

  1. Haga clic en Combinaciones.
  2. Haga clic en Agregar.
  3. Seleccione tablas izquierda y derecha en los menús desplegables.
  4. Escriba una Join condition (por ejemplo, accounts.id = opportunity.accountid)
    • (Opcional) Para condiciones de combinación más complicadas, use una expresión SQL. Haga clic en Usar expresión SQL y, a continuación, registre la condición de combinación como una expresión SQL.
  5. Seleccione un tipo de relación:
    • Muchos a uno: Varias filas de la izquierda se asignan a una fila de la derecha
    • Uno a varios: una fila de la izquierda se asigna a varias filas de la derecha
    • Uno a uno: una fila izquierda se asigna como máximo a una fila derecha

Instrucciones de combinación que muestran una relación de combinación identificada

Nota:

Cuando se usan varias combinaciones entre las mismas tablas o autocombinaciones, Genie genera automáticamente alias para la tabla derecha para evitar la ambigüedad.

Recibir sugerencias a partir de comentarios

Cuando los usuarios hacen clic en el pulgar arriba de un mensaje que combina tablas o utiliza expresiones SQL, Genie analiza la respuesta y puede sugerir nuevos fragmentos de código SQL (como medidas, uniones o filtros) para que los autores del espacio puedan revisar y agregar al almacén de conocimiento. Genie no aprende ni cambia automáticamente su comportamiento en función de los comentarios.

Definición de expresiones SQL

Interfaz de expresiones SQL que muestra medidas, filtros y dimensiones

Las expresiones SQL proporcionan una manera estructurada y guiada de enseñar a Genie sobre términos empresariales comunes, como KPI, atributos y condiciones. Genie puede usar cada una de estas definiciones pormenorizadas cuando un usuario le pregunte sobre ellas.

Las expresiones SQL complementan consultas SQL de ejemplo, especificadas en instrucciones. Aunque las expresiones SQL definen conceptos empresariales reutilizables, las consultas SQL de ejemplo son más útiles para enseñar a Genie cómo abordar los formatos comunes de solicitud de usuario. Por ejemplo, si los usuarios suelen pedir "un desglose del rendimiento", una consulta SQL de ejemplo puede mostrar que esto significa ventas cerradas por región, representante de ventas y administrador.

Las expresiones SQL funcionan mejor cuando es necesario:

  • Proporcionar definiciones estructuradas para KPI y métricas, como el margen de beneficio o la tasa de conversión
  • Dar contexto explícito a Genie sobre cómo calcular valores importantes
  • Definición de dimensiones adicionales para el conjunto de datos, como el mes o el segmento de cliente
  • Enseñe filtros de Genie para condiciones empresariales, como pedidos grandes o pedidos antes de un tiempo específico.

Tipos de expresiones SQL

Puede definir los siguientes tipos de expresiones SQL:

  • Medidas: indicadores clave de rendimiento (KPI) y métricas. Defina el nombre, el cálculo de SQL y los sinónimos.
  • Filtros: condiciones comunes de filtrado. Defina el nombre, la lógica del filtro SQL y los sinónimos.
  • Dimensiones: atributos para agrupar y analizar datos. Defina el nombre, la expresión SQL y los sinónimos.

Siga estas instrucciones para definir expresiones SQL:

  1. Haga clic en Configurar>instrucciones>expresiones SQL.
  2. Haga clic en Agregar. Elija Filtro, Medida o Dimensión.
  3. En el campo Nombre , escriba un nombre para la expresión.
  4. En el campo Código , escriba la expresión SQL.
  • Las expresiones de filtro deben evaluarse como una condición booleana.
  • Las expresiones de medida deben calcular una agregación en varias filas de la tabla.
  • Las expresiones de dimensión deben modificar el valor de cada fila de los datos existentes.
  1. En el campo Sinónimos , escriba formas comunes de que los usuarios puedan hacer referencia a las expresiones coloquialmente.
  2. En el campo Instrucciones , escriba instrucciones específicas que indiquen a Genie qué es la expresión y cómo trabajar con ella.

Pasos siguientes

Use los vínculos siguientes para ayudarle a seguir creando el espacio de Genie.