Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
El objetivo de mantener un espacio de Genie es crear un entorno en el que los usuarios empresariales puedan plantear preguntas de lenguaje natural y recibir respuestas precisas y coherentes en función de sus datos. Los espacios de Genie usan modelos avanzados que generan consultas sofisticadas y comprenden el conocimiento general del mundo.
La mayoría de las preguntas empresariales son específicas del dominio, por lo que el papel de un conservador espacial es salvar la brecha entre ese conocimiento general del mundo y el idioma especializado usado en un dominio específico o por una empresa determinada. Los conservadores usan metadatos e instrucciones para ayudar a Genie a interpretar y responder con precisión a las preguntas de los usuarios empresariales. En este artículo se describen los procedimientos recomendados y los principios para guiarle en el desarrollo de un espacio correcto.
Procedimientos recomendados para definir un nuevo espacio
En las secciones siguientes se recomiendan procedimientos para crear un espacio eficaz.
Comenzar por algo pequeño
La selección de un espacio de Genie es un proceso iterativo. Al crear un nuevo espacio, comience lo más pequeño posible, con instrucciones mínimas y un conjunto limitado de preguntas para responder. A continuación, puede agregar a medida que itera en función de los comentarios y la supervisión. Este enfoque ayuda a simplificar la creación y el mantenimiento del espacio y le permite organizarlo de forma eficaz en respuesta a las necesidades reales del usuario.
Use las instrucciones siguientes para ayudar a crear un pequeño espacio de Genie:
- Mantener el foco: incluya solo las tablas necesarias para responder a las preguntas que desea que controle el espacio. Apunte a cinco o menos tablas. Cuanto más centrado sea la selección, mejor. Mantener el espacio centrado estrechamente en una pequeña cantidad de datos es ideal, por lo que limitar el número de columnas de las tablas incluidas.
- Plan para iterar: comience con una configuración mínima para el espacio, centrándose en tablas esenciales e instrucciones básicas. Agregue instrucciones y ejemplos más detallados a medida que refina el espacio a lo largo del tiempo, en vez de apuntar a la perfección inicialmente.
- Compilación en tablas bien anotadas: Genie usa nombres y descripciones de columnas de Unity Catalog para generar respuestas. Borrar los nombres de columna y las descripciones ayudan a generar respuestas de alta calidad. Las descripciones de columna deben ofrecer información contextual precisa. Evite detalles ambiguos o innecesarios. Inspeccione las descripciones generadas por IA para obtener precisión y claridad, y úselas solo si se alinean con lo que proporcionaría manualmente.
Hacer que un experto en dominio defina el espacio
Un creador de espacio eficaz debe comprender los datos y la información que se puede obtener de él. Los analistas de datos que son expertos en SQL suelen tener conocimientos y aptitudes para mantener el espacio.
Definir el propósito del espacio
Identificar la audiencia y el propósito específicos del espacio le ayuda a decidir qué datos, instrucciones y preguntas de prueba usar. Un espacio debe responder a preguntas para un tema y público concretos, no preguntas generales en varios dominios. Puede simplificar los conjuntos de datos mediante la creación previa de tablas y la eliminación de columnas innecesarias antes de agregar datos a un espacio. A medida que agregue datos a su espacio, mantenga el enfoque estrictamente en el propósito definido de este. Oculte las columnas que puedan resultar confusas o no importantes. Consulte Mostrar u ocultar columnas.
Adición de metadatos y sinónimos
Puede agregar sinónimos de columna y descripciones personalizadas a los datos de un espacio de Genie. Estos metadatos se limitan al espacio de Genie y no sobrescriben los metadatos almacenados en el catálogo de Unity. Las descripciones y sinónimos de columna de calidad ayudan a Genie a comprender mejor la columna, elegirla para preguntas pertinentes y escribir SQL más precisa. Consulte Editar metadatos de columna.
Habilitación del muestreo de datos de Genie
Importante
Esta característica está en versión preliminar pública.
Un administrador del área de trabajo puede habilitar el muestreo de datos de Genie para el área de trabajo. El muestreo de datos mejora la precisión de Genie al muestrear valores de conjuntos de datos en el espacio de datos, lo que ayuda a que coincida mejor las solicitudes de los usuarios con las columnas y valores correctos. Cuando se habilita, Genie muestrea automáticamente los valores de las tablas mientras creas el espacio. Puede administrar qué columnas tienen datos muestreados. Consulte Administración de datos y Uso del muestreo de valores para mejorar la precisión de Genie.
Proporcionar ejemplos y instrucciones centrados
Los espacios de Genie funcionan mejor con un conjunto limitado y centrado de instrucciones. Databricks recomienda aprovechar consultas SQL de ejemplo para ofrecer instrucciones en tu espacio de trabajo. Las consultas de ejemplo en SQL permiten que Genie relacione las solicitudes del usuario con las consultas SQL verificadas y aprenda de los ejemplos para responder a preguntas relacionadas. Consulte Adición de consultas y funciones SQL de ejemplo.
Para el contexto que se debe aplicar globalmente en el espacio Genie, un pequeño conjunto bien organizado de instrucciones de texto sin formato también puede ayudar a mantener la relevancia y mejorar la calidad de la respuesta. Demasiadas instrucciones pueden reducir la eficacia, especialmente en conversaciones más largas, ya que Genie podría tener dificultades para priorizar las instrucciones más importantes. Para obtener más información, consulte Proporcionar instrucciones.
Prueba y ajuste
Debes ser el primer usuario de tu espacio. Después de crear un nuevo espacio, empiece a formular preguntas. Examine cuidadosamente el CÓDIGO SQL generado en respuesta a sus preguntas. Si Genie interpreta mal los datos, las preguntas o jerga empresarial, puede intervenir editando el SQL generado o proporcionando otras instrucciones específicas. Siga probando y editando hasta que obtenga respuestas confiables.
Después de revisar una pregunta, puede agregarla como una pregunta de referencia que puede usar para probar y puntuar tu espacio para evaluar de manera sistemática la precisión general. Puede usar variaciones y expresiones de preguntas diferentes para probar las respuestas de Genie. Consulte Uso de pruebas comparativas en un espacio de Genie.
Consulte Solución de problemas para obtener ideas sobre cómo corregir respuestas erróneas.
Realización de pruebas de usuario
Después de comprobar la calidad de la respuesta a través de las pruebas, reclute a un usuario empresarial para probar el espacio de Genie. Use las siguientes instrucciones para proporcionar un recorrido de usuario sin problemas y recopilar comentarios para mejorar en curso:
- Establezca las expectativas de que su trabajo es ayudar a refinar la sala.
- Pídales que centren sus pruebas en el tema específico y preguntas que el espacio está diseñado para responder.
- Si reciben una respuesta incorrecta, anime a los usuarios a agregar instrucciones y aclaraciones adicionales en el chat para refinar la respuesta. Cuando se proporciona una respuesta correcta, los usuarios deben votar a favor de la consulta final para minimizar errores similares en futuras interacciones.
- Indique a los usuarios voto a favor o en contra de las respuestas utilizando el mecanismo de retroalimentación integrado.
- Invite a los usuarios a compartir comentarios adicionales y preguntas sin resolver directamente con los autores del espacio. Los autores y editores pueden usar comentarios para refinar instrucciones, ejemplos y recursos de confianza.
Considere la posibilidad de proporcionar materiales de aprendizaje o un documento escrito con instrucciones para probar la sala y proporcionar comentarios. Dirija a los usuarios empresariales a Usar un espacio de Genie para explorar los datos empresariales para ayudarles a empezar a trabajar con un nuevo espacio de Genie.
A medida que los usuarios empresariales prueban el espacio, los editores de espacios pueden ver las preguntas que han hecho en la pestaña Supervisión . Continúe agregando contexto para ayudar a Genie a interpretar correctamente las preguntas y los datos para proporcionar respuestas precisas. Consulte Supervisión del espacio para obtener más información sobre la supervisión de espacios de Genie. También puede usar registros de auditoría para supervisar los comentarios relacionados con el espacio de Genie y revisar las solicitudes. Consulte Supervisión del uso de IA/BI con registros de auditoría y alertas.
Nota:
Los usuarios empresariales deben ser miembros del área de trabajo de origen para acceder al espacio. Consulte Permisos necesarios para obtener información acerca de cómo proporcionar los permisos adecuados para interactuar con el espacio.
Solución de problemas
En las secciones siguientes se describe cómo resolver problemas comunes.
Jerga empresarial mal entendida
La mayoría de las empresas o dominios tienen una abreviatura específica que usan para comunicarse sobre eventos específicos de la empresa. Por ejemplo, al hacer referencia a un año, siempre podría significar el año fiscal y este año fiscal podría comenzar en febrero o marzo en lugar de enero. Para habilitar que Genie responda a estas preguntas de forma natural y precisa, incluya instrucciones que asignen explícitamente su jerga empresarial a palabras y conceptos que Genie puede comprender. Consulte Proporcionar instrucciones.
Uso incorrecto de tablas o columnas
Si Genie intenta extraer datos de una tabla incorrecta o ejecutar análisis en columnas incorrectas, puede ajustar los datos de una de las maneras siguientes:
- Proporcione descripciones claras y precisas: compruebe las tablas y los metadatos asociados para comprobar que la terminología usada allí coincide con la terminología de los usuarios en las preguntas enviadas. Si no es así, refinar la descripción o agregar una instrucción que asigne la terminología usada en la tabla a la terminología usada en la pregunta.
- Agregar consultas de ejemplo: proporcione consultas SQL de ejemplo que Genie puede usar para obtener información sobre cómo responder a determinadas preguntas. Consulte Proporcionar instrucciones.
- Quitar tablas o columnas del espacio: algunas tablas pueden incluir columnas o conceptos superpuestos que dificultan que Genie sepa qué datos usar en una respuesta. Si es posible, quite tablas o columnas innecesarias o superpuestas. Para ocultar rápidamente las columnas de la interfaz de usuario del espacio de Genie, sin cambiar los objetos de datos subyacentes, vea Mostrar u ocultar columnas.
Errores de filtrado
Las consultas generadas suelen incluir una cláusula WHERE
para filtrar los resultados según un valor específico. Cuando Genie no tiene visibilidad sobre los valores de datos, puede establecer la WHERE
cláusula para filtrar el valor incorrecto. Por ejemplo, podría intentar coincidir con el nombre “California” cuando la tabla usa abreviaturas como “CA.”
Para situaciones como esta, pruebe una de las estrategias siguientes:
- Si es necesario, un administrador del área de trabajo debe habilitar el muestreo de datos de Genie desde la página Vistas previas . Esto permite características que ayudan a Genie a hacer coincidir mejor las indicaciones del usuario con los valores de columna. Consulte Uso del muestreo de valores para mejorar la precisión de Genie.
- Compruebe que las columnas pertinentes tienen habilitados valores de ejemplo y diccionarios de valores. Si se han agregado nuevos datos a las tablas pertinentes, actualice los valores. Consulte Ver columnas.
Combinaciones incorrectas
Si las referencias de clave externa no están definidas en tu Unity Catalog, es posible que tu entorno no sepa cómo combinar tablas diferentes.
Pruebe a implementar una o varias de las siguientes soluciones:
- Defina las referencias de clave externa en Unity Catalog siempre que sea posible. Consulte CONSTRAINT cláusula.
- Proporcione consultas de ejemplo en las que se unen tablas de maneras estándar.
- Si las relaciones de clave externa de las tablas no se especifican en el catálogo de Unity, documentelas en las instrucciones.
Si ninguno de estos resuelve el problema, únase previamente a la tabla en una vista y úselo como entrada para el espacio en su lugar. Esta estrategia es útil para escenarios de unión más complejos, como autocombinaciones.
Comentarios de columna que no se sincronizan desde tablas externas
Azure Databricks no administra los metadatos, los datos ni la semántica de las escrituras en tablas externas. En función de la tabla de origen, es posible que los comentarios no sean accesibles desde Azure Databricks. Para que los comentarios estén disponibles, Azure Databricks recomienda realizar una de las siguientes acciones:
- Edite los metadatos de columna en la interfaz del espacio Genie. Los metadatos editados solo se aplican al espacio de Genie donde se encuentran. Consulte Editar metadatos de columna.
- Cree vistas materializadas sobre tablas federadas. Puede agregar y editar comentarios en una vista materializada como lo haría en una tabla administrada. Puede reutilizar esta vista en diferentes espacios de Genie. Para obtener más información acerca de la carga de datos de tablas externas en una vista materializada, consulte Carga de datos de tablas externas con vistas materializadas. Para obtener más información sobre cómo trabajar con vistas materializadas, consulte Vistas materializadas.
Problemas de cálculo de métricas
La forma en que se calculan y se recopilan las métricas puede ser arbitrariamente compleja y abarcar muchos detalles de negocio que su área no entiende. Esto puede provocar informes incorrectos.
Pruebe a implementar una o varias de las siguientes soluciones:
- Si las métricas se agregan a partir de tablas base, proporcione un ejemplo de consultas SQL que calculan cada valor acumulativo.
- Si las métricas se han calculado previamente y se encuentran en tablas agregadas, explíquela en los comentarios de la tabla. Especifique agregaciones válidas para cada métrica si las métricas de esa tabla se pueden inscribir aún más.
- Si el SQL que está intentando generar es muy complicado, intente crear vistas que ya hayan agregado las métricas para su espacio.
Cálculos incorrectos basados en el tiempo
Es posible que Genie no siempre pueda deducir la zona horaria representada en los datos o la zona horaria en la que se debe realizar el análisis a menos que proporcione explícitamente instrucciones adicionales.
Incluya instrucciones más explícitas que detallan la zona horaria de origen original, la función de conversión y la zona horaria de destino. En los ejemplos siguientes se muestra cómo modificar las instrucciones generales para conversiones de zona horaria más confiables:
-
Convertir siempre las horas en una zona horaria específica: en este ejemplo, supongamos que la marca de tiempo de origen es
UTC
y desea obtener resultados en la zona horariaAmerica/Los_Angeles
. Agregue lo siguiente a las instrucciones y reemplace<timezone-column>
por el nombre de columna adecuado:- Las zonas horarias de las tablas se encuentran en
UTC
. - Convierta todas las zonas horarias mediante la función siguiente:
convert_timezone('UTC', 'America/Los_Angeles', <timezone-column>)
.
- Las zonas horarias de las tablas se encuentran en
-
Convertir formatos de fecha y hora no UTC a UTC: si la zona horaria predeterminada del área de trabajo es
UTC
pero los usuarios de Los Ángeles deben hacer referencia hoy para un conjunto específico de registros, agregue lo siguiente a las instrucciones generales del espacio:- Para hacer referencia hoy, use 'date(convert_timezone('UTC', 'America/Los_Angeles', current_timestamp()))
Consulte convert_timezone
función para obtener más detalles y sintaxis.
Omitir instrucciones
Incluso si ha explicado las tablas y columnas en comentarios y ha proporcionado instrucciones generales, es posible que el espacio todavía no los use correctamente.
Pruebe una o más de las estrategias siguientes:
- Proporcione consultas de ejemplo que usen correctamente las tablas. Las consultas de ejemplo son especialmente eficaces para enseñar el espacio a usar los datos.
- Ocultar columnas irrelevantes en el espacio de Genie. Consulte Mostrar u ocultar columnas.
- Cree vistas a partir de las tablas que proporcionan una vista más sencilla de los datos.
- Revise las instrucciones e intente centrar el espacio quitando las tablas o instrucciones irrelevantes.
- Intente iniciar un nuevo chat. Las interacciones anteriores pueden influir en las respuestas de Genie en cualquier chat dado, pero iniciar un nuevo chat le ofrece un punto de partida en blanco para probar nuevas instrucciones.
Problemas de rendimiento
Cuando Genie necesita generar consultas o respuestas de texto excepcionalmente largas, puede tardar mucho tiempo en responder o incluso agotar el tiempo de espera durante la fase de pensamiento.
Pruebe una o varias de las siguientes acciones para mejorar el rendimiento:
- Use recursos o vistas de confianza para encapsular consultas complejas. Consulte Uso de recursos de confianza en espacios de AI/BI Genie.
- Reduzca la longitud de las consultas SQL de ejemplo siempre que sea posible.
- Inicie un nuevo chat si Genie comienza a generar respuestas lentas o con errores.
Respuestas poco confiables a preguntas críticas
Use recursos de confianza para proporcionar respuestas comprobadas a preguntas específicas que espera que los usuarios hagan. Consulte Uso de recursos de confianza en espacios de AI/BI Genie.
Advertencia de límite de tokens
Los tokens son las unidades básicas de texto que Genie usa para procesar y comprender el lenguaje. El texto incluido como instrucciones o metadatos en un espacio de Genie se convierte en tokens. Si el número de tokens del espacio está cerca del límite, el producto le notifica con advertencias. Genie aplica el filtrado de contexto inteligente para seleccionar los tokens que representan los metadatos y algunos tipos de instrucciones incluidos en el espacio de Genie. Incluso si supera el límite, el espacio debe seguir generando respuestas a preguntas.
Si el espacio de Genie se aproxima al límite de tokens, Genie podría dar prioridad a incluir solo las partes del esquema de tabla y las instrucciones más relevantes para la pregunta. Esto puede reducir la calidad de respuesta si se filtra el contexto importante. Tenga en cuenta los procedimientos siguientes para reducir el número de tokens:
- Quitar columnas innecesarias: las columnas innecesarias de las tablas pueden aumentar significativamente el uso de tokens. Cuando sea posible, cree vistas para excluir campos redundantes o no esenciales de las tablas originales. También puede ocultar columnas innecesarias en un espacio de Genie. Consulte Mostrar u ocultar columnas.
-
Simplificar las descripciones de columnas: aunque las descripciones de columnas son importantes, evite repetir la información que ya haya transmitido en los nombres de columna. Por ejemplo, si una columna se denomina
account_name
, una descripción como “el nombre de la cuenta” podría ser redundante y se puede omitir. - Editar metadatos de columna en el espacio de Genie: vea Editar metadatos de columna para obtener información sobre cómo editar descripciones y proporcionar sinónimos en los metadatos de columna.
- Depurar instrucciones SQL de ejemplo: incluya una amplia gama de instrucciones SQL de ejemplo para cubrir diversos tipos de preguntas, pero elimine aquellos ejemplos que sean superfluos o redundantes.
- Simplificar instrucciones: compruebe que las instrucciones sean claras y concisas. Evite palabras innecesarias.
La cuenta no está habilitada para el procesamiento entre regiones geográficas
Genie es un Servicio designado administrado por Azure Databricks. Los servicios designados usan Databricks Geos para administrar la residencia de datos. Los datos no se pueden procesar en la misma ubicación geográfica que el espacio de trabajo para algunas regiones. Si su área de trabajo se encuentra en una de esas regiones, el administrador de su cuenta debe habilitar el procesamiento cross-Geo 2.
Alcanzar los límites de rendimiento
Al acceder a espacios de Genie a través de la interfaz de usuario de Azure Databricks, el rendimiento se limita a 20 preguntas por minuto por área de trabajo, en todos los espacios de Genie.
Al acceder a espacios de Genie mediante el nivel gratuito (Public Preview) de la API de Conversación, el rendimiento se limita a un máximo de cinco preguntas por minuto por espacio de trabajo, en todos los espacios de Genie. Consulte Uso de Genie Conversation API para integrar Genie en sus aplicaciones.