Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
El almacén de conocimiento de Genie le permite organizar y mejorar el espacio a través de metadatos localizados, la coincidencia de mensajes y las instrucciones de SQL estructuradas. Estas características ayudan a Genie a comprender los datos y a generar respuestas más precisas y relevantes.
¿Qué es un almacén de conocimiento?
Un almacén de conocimiento es una colección de definiciones semánticas mantenidas que mejora la comprensión de los datos de Genie y mejora la precisión de la respuesta.
El almacén de conocimiento consta de:
- Personalización de metadatos de nivel de espacio: descripciones específicas del espacio para tablas, columnas y términos y sinónimos empresariales.
- Personalización de datos de nivel de espacio: conjuntos de datos simplificados y centrados sin cambiar las tablas subyacentes del catálogo de Unity.
- Coincidencia de mensajes: ejemplos que ayudan a Genie a hacer coincidir los valores más relevantes para la pregunta del usuario y corregir los problemas ortográficos en las solicitudes del usuario. Esto incluye asistencia de formato y coincidencia de entidades.
-
Relaciones de combinación: relaciones de tabla definidas para instrucciones precisas
JOIN. - Expresiones SQL: definiciones estructuradas de medidas, filtros y dimensiones que capturan lógica de negocios.
Todas las configuraciones del almacén de conocimiento se limitan al espacio de Genie y no afectan a los metadatos de Unity Catalog ni a otros recursos de Azure Databricks.
Administración de metadatos del almacén de conocimiento
Enseñar a Genie sobre los datos en su espacio proporcionando descripciones de tablas y columnas locales y agregando sinónimos de columna que correspondan con términos empresariales comunes. Simplifique los conjuntos de datos ocultando columnas innecesarias o duplicadas para mantener el foco de Genie.
Estas prácticas mejoran la facilidad de uso para los usuarios que no tienen permisos directos en las tablas subyacentes y también admiten iteraciones más rápidas al actualizar versiones de instrucción.
Para acceder a los metadatos de nivel de espacio, haga clic en Configurar > datos en el espacio de Genie. A continuación, haga clic en un nombre de tabla para ver sus metadatos y columnas.
Ver columnas
Haga clic en un nombre de tabla para ver información general sobre los nombres y detalles de las columnas. En el ejemplo siguiente se muestra un ejemplo de una tabla denominada accounts.
Descripción: Genie usa metadatos para comprender los datos y generar respuestas precisas. La descripción de la tabla predeterminada muestra los metadatos del catálogo de Unity asociados al recurso de datos. Edite esta descripción para agregar instrucciones específicas que ayuden a Genie a redactar SQL para su espacio. Haga clic en Restablecer para restaurar la descripción del catálogo de Unity.
Columnas: Los nombres de columna y las descripciones se incluyen en la lista de columnas. Cada columna está identificada con etiquetas que muestran si incluye Ayuda de Formato o Coincidencia de Entidades. Consulte Introducción a la coincidencia de mensajes.
Ocultar o mostrar columnas pertinentes
Las columnas se pueden administrar individualmente o de forma masiva. Use las instrucciones siguientes para ocultar o mostrar columnas.
-
Ocultar una sola columna: haga clic en el
situado junto al nombre de la columna. -
Ocultar varias columnas:
- Active las casillas de las columnas que desea ocultar.
- En el menú Acciones , seleccione Ocultar columnas seleccionadas.
- Deshacer cambios: repita los mismos pasos para mostrar una columna que estaba oculta.
Edición de metadatos de columna
Puede personalizar lo siguiente para cada columna:
- Descripción: descripciones de columnas específicas del espacio que mejoran la comprensión de Genie.
- Sinónimos: términos empresariales y palabras clave que ayudan a hacer coincidir el idioma del usuario con los nombres de columna.
-
Configuración avanzada: solicitar controles coincidentes.
- Ayuda de formato: active o desactive el muestreo de valores representativos.
- Coincidencia de entidades: habilite o deshabilite la coincidencia de entidades para las columnas de categorías.
Para editar metadatos de columna:
- Haga clic en el
Icono de lápiz situado junto a un nombre de columna.
- Edite la descripción y los sinónimos de la columna.
- Si es necesario, haga clic en Configuración avanzada para abrir controles de coincidencia de mensajes.
- Haga clic en Guardar para mantener los cambios y cerrar el cuadro de diálogo.
Introducción a la coincidencia de mensajes
La coincidencia de solicitudes permite que Genie encuentre las columnas y los valores más relevantes para la pregunta del usuario y además corregir problemas ortográficos en las solicitudes del usuario. Esto mejora la precisión de Genie y ayuda a generar consultas SQL más confiables.
Cuando un usuario hace una pregunta en Genie, la expresión suele ser conversacional y puede incluir errores como errores ortográficos. En estos casos, es posible que los valores de la indicación no coincidan con la estructura o los valores de los datos. Esto puede hacer que Genie malinterprete la pregunta y genere SQL incorrecto.
Example
Revise el ejemplo siguiente:
"Muéstrame ventas de coches en Florida para Q1."
Si los datos usan abreviaturas de estado (como FL), y Genie no puede tener acceso a los valores de esa columna, Genie podría generar SQL que incluya ILIKE '%Florida%', que no devuelve ningún resultado.
La habilitación de la coincidencia de entidades en la state columna permite a Genie acceder a valores representativos. Con este contexto, Genie puede reconocer que FL corresponde a "Florida" y generar SQL más preciso.
| Sin coincidencia de entidades | Con coincidencia de entidades |
|---|---|
WHERE state ILIKE '%Florida%' |
WHERE state = 'FL' |
Componentes de coincidencia de prompt
- Asistencia de formato: la asistencia de formato proporciona valores representativos para todas las columnas aptas, lo que ayuda a Genie a comprender los tipos de datos y los patrones de formato. Los valores representativos para la coincidencia instantánea se generan utilizando los permisos de datos del autor. Estos valores forman parte del contexto compartido del espacio y ayudan a Genie a interpretar los mensajes del usuario con mayor precisión para todos los participantes del espacio.
- Coincidencia de entidades: la coincidencia de entidades proporciona listas seleccionadas de valores distintos para hasta 120 columnas en las que es probable que los usuarios hagan referencia a entradas específicas, como estados y categorías de productos. Esto ayuda a Genie a hacer coincidir la terminología del usuario con los valores de datos reales. Cada columna puede incluir hasta 1024 valores distintos, cada uno de ellos hasta 127 caracteres de longitud. Los datos de coincidencia de entidades se almacenan en el bucket de almacenamiento del área de trabajo.
Genie proporciona automáticamente asistencia de formato y coincidencia de entidades para las columnas aptas a medida que agrega tablas al espacio. Las tablas con filtros de fila o máscaras de columna se excluyen de la coincidencia de solicitudes.
Administrar la coincidencia de mensajes
Gestiona las columnas que proporcionan asistencia de formato y coincidencia de entidades para mejorar cómo Genie comprende tus datos. La coincidencia de prompts está habilitada de forma predeterminada para todos los espacios de Genie.
Gestión de la asistencia de formato
La asistencia de formato se aplica automáticamente al agregar tablas a un espacio de Genie.
Para desactivar la asistencia de formato para una columna:
- Haga clic en Configurar > Datos en el espacio de Genie.
- Haga clic en un nombre de tabla para ver sus columnas.
- Haga clic en el
Icono de lápiz situado junto al nombre de la columna.
- Haz clic en Avanzado.
- Desactivar la asistencia de formato.
Esta acción también deshabilita automáticamente la coincidencia de entidades para esa columna. Si es necesario, use esta opción para volver a activar la asistencia de formato .
Configuración de la coincidencia de entidades
Genie genera respuestas mediante el aviso, los metadatos de la tabla pertinentes, las funcionalidades de coincidencia de mensajes, las señales de error y cualquier código o consulta de entrada. Cuando una columna tiene habilitada la coincidencia de entidades, Genie utiliza los valores almacenados para alinear las solicitudes del usuario con los datos reales con mayor precisión. Esto genera consultas SQL más confiables. La coincidencia de entidades mejora significativamente la precisión de Genie, especialmente cuando se combina con consultas de ejemplo claras y instrucciones bien diseñadas. Consulte Curar un espacio eficaz de Genie para obtener más instrucciones.
Genie impide habilitar la coincidencia de entidades en tablas con filtros de fila o máscaras de columna. Sin embargo, los autores de espacios deben deshabilitar la coincidencia de entidades para las vistas que hacen referencia a tablas con filtros de fila o máscaras de columna, o para vistas dinámicas.
En la lista siguiente se incluyen ejemplos de los tipos de datos que funcionan bien con la coincidencia de entidades:
- Códigos de estado o país
- Categorías de productos
- Códigos de estado
- Nombres de departamento
Para habilitar la coincidencia de entidades, se debe activar la asistencia de formato . Después, siga estos pasos:
- Haga clic en Configurar > Datos en el espacio de Genie.
- Haga clic en un nombre de tabla para ver sus columnas.
- Haga clic en el
Icono de lápiz situado junto al nombre de la columna.
- Haz clic en Avanzado.
- Active la coincidencia de entidades .
- Para deshabilitar la coincidencia de entidades para una columna, desactive La coincidencia de entidades .
Actualizar o quitar datos coincidentes del aviso
Actualizar la solicitud de coincidencia de datos actualiza los valores almacenados de una columna. Actualice los valores si:
- Se han agregado nuevos valores a la columna.
- El formato de los valores existentes ha cambiado.
Para actualizar los datos coincidentes de mensajes, haga clic en El menú kebab de la vista de columna y, a continuación, actualice la coincidencia de mensajes.
Definir relaciones de unión
Ayuda a Genie a crear declaraciones precisas JOIN definiendo relaciones de tabla.
- Haga clic en Combinaciones.
- Haga clic en Agregar.
- Seleccione tablas izquierda y derecha en los menús desplegables.
- Escriba una Join condition (por ejemplo,
accounts.id = opportunity.accountid)- Para obtener condiciones de combinación más complicadas, haga clic en Usar expresión SQL y, a continuación, registre la condición de combinación como una expresión SQL.
- Seleccione un tipo de relación:
- Muchos a uno: Varias filas de la izquierda se asignan a una fila de la derecha
- Uno a varios: una fila de la izquierda se asigna a varias filas de la derecha
- Uno a uno: una fila izquierda se asigna como máximo a una fila derecha
Nota:
Cuando se usan varias combinaciones entre las mismas tablas o autocombinaciones, Genie genera automáticamente alias para la tabla derecha para evitar la ambigüedad.
Recibir sugerencias a partir de comentarios
Cuando los usuarios hacen clic en el pulgar arriba de un mensaje que combina tablas o utiliza expresiones SQL, Genie analiza la respuesta y puede sugerir nuevos fragmentos de código SQL (como medidas, uniones o filtros) para que los autores del espacio puedan revisar y agregar al almacén de conocimiento. Genie no aprende ni cambia automáticamente su comportamiento en función de los comentarios.
Definición de expresiones SQL
Las expresiones SQL proporcionan una manera estructurada y guiada de enseñar a Genie sobre términos empresariales comunes, como KPI, atributos y condiciones. Genie usa estas definiciones cuando un usuario pregunta sobre estos términos empresariales.
Las expresiones SQL complementan consultas SQL de ejemplo, especificadas en instrucciones. Las expresiones SQL definen conceptos empresariales reutilizables, pero las consultas SQL de ejemplo son más útiles para enseñar a Genie cómo abordar los formatos comunes de solicitud de usuario. Por ejemplo, si los usuarios suelen pedir "un desglose del rendimiento", una consulta SQL de ejemplo puede mostrar que esto significa ventas cerradas por región, representante de ventas y administrador.
Las expresiones SQL funcionan mejor cuando es necesario:
- Proporcionar definiciones estructuradas para KPI y métricas, como el margen de beneficio o la tasa de conversión
- Dar contexto explícito a Genie sobre cómo calcular valores importantes
- Definición de dimensiones adicionales para el conjunto de datos, como el mes o el segmento de cliente
- Enseñe filtros de Genie para condiciones empresariales, como pedidos grandes o pedidos antes de un tiempo específico.
Tipos de expresiones SQL
Puede definir los siguientes tipos de expresiones SQL:
- Medidas: indicadores clave de rendimiento (KPI) y métricas. Defina el nombre, el cálculo de SQL y los sinónimos.
- Filtros: condiciones comunes de filtrado. Defina el nombre, la lógica del filtro SQL y los sinónimos.
- Dimensiones: atributos para agrupar y analizar datos. Defina el nombre, la expresión SQL y los sinónimos.
Siga estas instrucciones para definir expresiones SQL:
- Haga clic en Configurar>instrucciones>expresiones SQL.
- Haga clic en Agregar. Elija Filtro, Medida o Dimensión.
- En el campo Nombre , escriba un nombre para la expresión.
- En el campo Código , escriba la expresión SQL.
- Las expresiones de filtro deben evaluarse como una condición booleana.
- Las expresiones de medida deben calcular una agregación en varias filas de la tabla.
- Las expresiones de dimensión deben modificar el valor de cada fila de los datos existentes.
- En el campo Sinónimos , escriba formas comunes de que los usuarios puedan hacer referencia a las expresiones coloquialmente.
- En el campo Instrucciones , escriba instrucciones específicas que indiquen a Genie qué es la expresión y cómo trabajar con ella.
Pasos siguientes
Use los vínculos siguientes para ayudarle a seguir creando el espacio de Genie.
- Agregue contexto al espacio de Genie para ayudar a generar respuestas precisas. Consulte Adición de ejemplos e instrucciones de SQL.
- Obtenga información sobre los procedimientos recomendados para optimizar el espacio de Genie. Consulta Curar un espacio eficaz de Genie
- Evalúe y mejore el rendimiento del espacio. Consulte Uso de pruebas comparativas en un espacio de Genie