Compartir a través de


Obtener ayuda de codificación con el Asistente de Databricks

En este artículo se describe cómo puede usar Databricks Assistant para ayudarle a codificar y depurar los cuadernos, y se proporcionan sugerencias sobre cómo sacar el máximo partido del Asistente.

¿Con qué puede ayudar Databricks Assistant?

Databricks Assistant es un asistente de IA consciente del contexto con el que puede interactuar utilizando una interfaz conversacional, haciéndole más productivo dentro de Databricks. Puede describir la tarea en inglés y permitir que el asistente genere código de Python o consultas SQL, explicar código complejo y corregir errores automáticamente. El asistente usa metadatos de Unity Catalog para comprender las tablas, las columnas, las descripciones y los recursos de datos populares de toda la empresa y así proporcionar respuestas personalizadas.

Databricks Assistant puede ayudarle con las siguientes tareas:

  • Generar código.
  • Depurar el código, incluida la identificación y la sugerencia de correcciones de errores.
  • Transformar y optimizar el código.
  • Explicar el código.
  • Encontrar información pertinente en la documentación de Azure Databricks.

Para obtener información sobre cómo habilitar y usar Databricks Assistant, consulte Habilitar e probar Databricks Assistant. Para obtener información general sobre Databricks Assistant, consulte Características con tecnología de inteligencia artificial de Databricks.

Métodos abreviados de comandos de Assistant para cuadernos

En un cuaderno, Databricks Assistant está disponible en el panel del asistente o insertado en una celda de código.

Para usar Databricks Assistant directamente en una celda de código, presione Cmd+I en MacOS o Ctrl+I en Windows. Aparece un cuadro de texto en la celda. Puede escribir una pregunta o comentario en inglés y, a continuación, presionar Enter (no Shift+Enter, como haría para ejecutar una celda) para que assistant genere una respuesta.

El asistente insertado le ayuda a localizar y agregar datos de enriquecimiento.

Uso de comandos de barra diagonal para solicitudes

Los comandos de barra diagonal son un acceso directo para crear solicitudes comunes.

Texto de solicitud Qué hace Assistant
/ Muestra comandos comunes
/doc Comenta el código en una vista de diferencias
/explain Proporciona una explicación del código de una celda
/fix Propone una corrección de los errores de código en una vista de diferencias
/findTables Busca tablas pertinentes basadas en metadatos de Unity Catalog. Para buscar características o tablas de características, mencione "características" o "tablas de características" en la consulta. Consulte Busque características y tablas de características mediante Databricks Assistant.
/findQueries Busca consultas pertinentes basadas en metadatos de Unity Catalog.
/optimize Mejora el código SQL y Python.
/prettify Da formato al código para mejorar la legibilidad.
/rename Sugiere nombres actualizados para las celdas del cuaderno y otros elementos en función del contexto.
/settings Ajusta la configuración del cuaderno directamente desde Assistant.

Cuando use /fix o /doc, en la ventana de diferencias seleccione Aceptar para aceptar los cambios propuestos o Rechazar para mantener el código original. Si acepta el código propuesto, el código no se ejecuta automáticamente. Puede revisar el código antes de ejecutarlo. Si el código generado no es lo que desea, inténtelo de nuevo agregando más detalles o información al comentario. Consulte Sugerencias para usar Databricks Assistant.

Obtenga explicaciones detalladas de fragmentos de código. Use el mensaje /explain e incluya términos como "ser conciso" o "explicar el código línea a línea" para solicitar el nivel de detalle que quiera. También puede pedirle al Asistente para Databricks que agregue comentarios al código.

La característica de autocompletar el código, el rendimiento podría ser mejor si usa el panel del Asistente que el de una celda del cuaderno.

Assistant se cierra automáticamente si Acepta o Rechaza el código que ha generado.

Haga referencia a tablas en las solicitudes mediante @

Para hacer referencia rápidamente a las tablas de las indicaciones del Asistente, use el símbolo @ (arroba).

Referencia a tablas en una solicitud de Assistant mediante el símbolo @

Obtenga ayuda con el código

Databricks Assistant le ayuda con el código, tanto de SQL como Python:

  • Autocompletar basado en IA en cuadernos de Databricks, el editor de SQL y el editor de archivos.
  • Filtrado de datos con solicitudes en lenguaje natural.
  • Depuración de código con Diagnosticar error.

Obtención de sugerencias de código insertado: ejemplos de Python y SQL

A medida que escriba, las sugerencias aparecerán automáticamente. Presione Tab para aceptar una sugerencia. Para desencadenar manualmente una sugerencia, presione Option+Shift+Space (en macOS) o Control+Shift+Space (en Windows).

GIF animado de finalización de código para SQL.

GIF animado de finalización de código para Python.

El autocompletado basado en IA también puede generar código a partir de comentarios:

GIF animado de finalización de código de un comentario.

Filtrado de datos con solicitudes en lenguaje natural

Use Databricks Assistant para filtrar las salidas de datos con solicitudes en lenguaje natural.

Para filtrar la salida con lenguaje natural, haga clic en el icono de filtro de la tabla de salida y escriba una solicitud. Por ejemplo, como en el ejemplo animado siguiente, puede pedir "Muéstrame solo hombres mayores de 70 años".

El GIF animado muestra a Databricks Assistant filtrando a los hombres mayores de 70 años en una tabla de supervivientes del Titanic.

Depuración de código: ejemplos de Python y SQL

A fin de usar el Asistente de Databricks para corregir el código, realice cualquiera de las acciones siguientes:

  • Formule una pregunta en el panel Asistente.
  • Haga clic en el botón Diagnosticar error que aparece en los resultados de la celda cuando se produce un error.
  • Haga clic en Depurar para recorrer de forma interactiva el código línea a línea, establecer puntos de interrupción, inspeccionar variables y analizar la ejecución de un programa.

En las pestañas siguientes se muestran ejemplos de error de diagnóstico en código de Python y SQL:

Pitón

Ejemplo de depuración del asistente en Python.

SQL

Al seleccionar Diagnosticar error, el Asistente ejecuta automáticamente un comando "/fix".

Ejemplo de depuración del asistente en SQL.

Al hacer clic en Diagnosticar error, Assistant ejecuta automáticamente /fix.

Optimización del código python, PySpark y SQL

Con el comando de barra diagonal /optimize, evalúe y optimice el código en Python, PySpark y SQL.

  1. En una celda del cuaderno o en el editor de SQL, haga clic en el icono de Assistant Icono del Asistente de ayuda en el producto: color.
  2. En el cuadro de entrada, escriba /optimize, y haga clic en el botón Generar.
  3. Para usar las sugerencias de optimización del Asistente, haga clic en Aceptar.

Utiliza el comando de optimización en un notebook.

Este es el modo en que /optimize ayuda con el código:

  • Advertencias antes de ejecutar: Los subrayados amarillos resaltan las oportunidades para optimizar tu consulta antes de la ejecución, como cuando no estás filtrando en una columna de partición. Mantenga el puntero sobre el texto subrayado para ver las sugerencias de optimización.
  • Análisis posterior a la ejecución: Después de ejecutar el código, haga clic en el botón Optimizar .
  • Sugerencias de nivel de tabla: Por ejemplo, cuando los usuarios crean una tabla, reciben una sugerencia que recomienda CREATE TABLE CLUSTER BY AUTO.

Corrección rápida

Cuando el código devuelve errores, Corrección rápida recomienda automáticamente correcciones de errores básicos que se pueden corregir con un único cambio de línea.

Haga clic en Aceptar y ejecutar para realizar la corrección recomendada y continuar ejecutando el código:

Captura de pantalla de la IU de corrección de errores en línea de Databricks Assistant.

Sugerencias para usar Databricks Assistant

En esta sección se incluyen algunas sugerencias generales y procedimientos recomendados al usar Databricks Assistant.

Databricks Assistant usa el contexto para proporcionar mejores respuestas

El Asistente de Databricks tiene acceso a los metadatos y esquemas de tabla y columna. Esto le permite usar lenguaje natural y generar consultas bastante precisas. Por ejemplo, si una tabla tiene una columna Estado, puede pedirle al Asistente de Databricks que genere una lista de usuarios que viven en Michigan.

Databricks Assistant usa el siguiente contexto:

  • Código o consultas en la celda del cuaderno actual o en la pestaña Editor de Databricks SQL.
  • Nombres y descripciones de tablas y columnas.
  • Preguntas de solicitud anteriores.
  • Tablas favoritas y activas.
  • Para la característica de diagnóstico de errores, el seguimiento de la pila de la salida del error.

Al seleccionar columnas de un DataFrame, puede obtener resultados más precisos proporcionando una consulta inicial. Por ejemplo, proporcione una instrucción como SELECT * FROM <table_name>. Esto permite que Databricks Assistant obtenga los nombres de columna y no tenga que adivinar.

Dado que Databricks Assistant usa el historial de conversaciones para proporcionar respuestas más adecuadas y precisas, puede pedirle que modifique la salida de una respuesta anterior sin tener que volver a escribir toda la solicitud, como se muestra a continuación. Use el historial de chats del Asistente para limpiar, explorar, filtrar y segmentar dataFrames de forma iterativa en el panel Asistente.

Sea específico

La estructura y los detalles que proporciona Databricks Assistant varían de vez en cuando, incluso para la misma solicitud. Intente proporcionar a Assistant tantas instrucciones como pueda para ayudarle a devolver la información que desea en el formato, el nivel de detalle, etc. que desee. Por ejemplo:

  • "Explica este código en un par de oraciones" o "Explica este código línea por línea".
  • "Crea una visualización mediante MatPlotLib" o "Crea una visualización mediante Seaborn".

Proporcione ejemplos de valores de datos a nivel de fila.

Dado que Databricks Assistant no usa datos de nivel de fila, puede que necesite proporcionar más detalles a las solicitudes para obtener una respuesta lo más precisa posible. Use comentarios de tabla o columna en el Explorador de catálogos para agregar una línea de datos de ejemplo. Por ejemplo, supongamos que su columna de altura tiene el formato feet-inches. Para ayudar a Assistant a interpretar los datos, añada un comentario como “La columna de la altura está en formato de cadena y separada por un guion. Ejemplo: '6-2'". Para obtener información sobre los comentarios de tablas y columnas, consulte Incorporación de comentarios a los recursos de datos e inteligencia artificial.

Si tiene que usar conversiones de tipos de datos de columna para ejecutar una operación, es posible que tenga que proporcionar detalles. Por ejemplo, "Convierte este código de Pandas a PySpark, incluido el código necesario para convertir el DataFrame de Pandas en uno de PySpark y cambiar el tipo de datos del abandono de columnas de booleano a entero".

Usar Mayús+Entrar para agregar una nueva línea en el cuadro de texto del chat

Use Mayús+Entrar para agregar una nueva línea en el cuadro de texto del asistente de chat. Esto facilita el cambio de formato y la organización de los mensajes en Databricks Assistant.

Editar y ejecutar código en el panel de chat de Databricks Assistant

Ejecute código en el panel Asistente para validarlo o usarlo como panel temporal. Para ejecutar código, haga clic en icono de ejecutar código en la esquina superior izquierda del cuadro de código en el panel del asistente.

En las pestañas siguientes se muestran ejemplos de código de Python y SQL:

Pitón

Ejecute código de Python en el panel del asistente.

SQL

Ejecute código SQL en el panel del asistente.

Al ejecutar código en el panel del asistente, se muestra la salida y las variables se pueden usar en el cuaderno.

También puede editar el código que Databricks Assistant genera directamente en el cuadro de chat del asistente antes de moverlo al cuaderno.

Información adicional

Los artículos siguientes contienen información adicional sobre el uso de Databricks Assistant: