Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Importante
Esta característica se encuentra en su versión beta. Los administradores del área de trabajo pueden controlar el acceso a esta característica desde la página Vistas previas . Consulte Administración de versiones preliminares de Azure Databricks.
En esta página se presenta Data Science Agent, un agente de datos de IA disponible seleccionando Modo de agente en Databricks Assistant. Diseñado específicamente para cuadernos de Databricks y el Editor de SQL, explora datos, genera y ejecuta código y corrige errores, todo ello desde un único símbolo del sistema.
¿Qué es Data Science Agent?
Data Science Agent es una funcionalidad eficaz en el modo agente de Databricks Assistant que transforma al Asistente en un compañero inteligente que puede automatizar flujos de trabajo completos de ciencia de datos en varios pasos en cuadernos de Databricks y el Editor de SQL.
En comparación con el modo de chat del asistente, el modo agente ha ampliado las funcionalidades: planear una solución, recuperar recursos relevantes, ejecutar código, usar salidas de celda para mejorar los resultados, corregir errores automáticamente y mucho más.
Data Science Agent puede planear y generar código para ejecutarse en cuadernos o consultas para ejecutarse en el editor de SQL. El agente trabaja con usted para aprobar sus planes y confirmar sus pasos siguientes antes de continuar. Con la aprobación, Data Science Agent puede usar herramientas para realizar tareas como buscar tablas, editar un cuaderno, ejecutar celdas y leer salidas de celdas.
El acceso y las acciones del Agente de ciencia de datos se rigen por los permisos del usuario. Solo puede acceder a los datos a los que tiene acceso y realizar operaciones para las que tenga permisos.
Requisitos
Para usar Data Science Agent, el área de trabajo necesita lo siguiente:
- Características de inteligencia artificial con tecnología de asociados habilitadas para la cuenta y el área de trabajo. Consulte funcionalidades de IA impulsadas por socios.
- Versión preliminar del Agente de ciencia de datos habilitada. Consulte Administración de versiones preliminares de Azure Databricks.
Uso del Agente de ciencia de datos
Para usar Data Science Agent:
En un cuaderno de Databricks o en el Editor de SQL, abra el panel lateral Asistente.
En la esquina inferior derecha, seleccione Agente. Esto activa el modo agente del asistente, lo que le permite interactuar con el Agente de ciencia de datos.
Escriba un mensaje para el Agente. Por ejemplo, "Analizar
@sales_transactionsde samples.bakehouse para identificar el producto más vendido".Sugerencia
Haga referencia a tablas específicas mediante
@table_name. El agente usará esa tabla y los metadatos asociados para conservar su respuesta. El agente respeta los permisos del catálogo de Unity del usuario, por lo que solo puede acceder a los datos a los que tiene acceso.A medida que el agente genera su respuesta, a menudo se pausa para obtener la entrada:
Para tareas más complejas, el agente puede crear un plan paso a paso y formular preguntas aclaradas. Responda a las preguntas aclarando del Agente para ayudarle a perfeccionar su plan.
Cuando el agente necesita ejecutar código, solicita su aprobación antes de continuar. Permitir o Rechazar su solicitud. También puede seleccionar Permitir en este subproceso (haciendo referencia al subproceso de conversación del Asistente) o Permitir siempre.
Importante
Data Science Agent puede generar y ejecutar código en el cuaderno. Aunque tiene barreras de protección para evitar acciones peligrosas, todavía existe riesgo. Solo debe usarlo con código y datos de confianza.
A medida que el agente continúa su trabajo, es posible que se le pida que seleccione Continuar o Rechazar. Revise el trabajo existente del agente y, a continuación, seleccione Continuar para permitir que el Agente continúe con los pasos siguientes o Rechazar para indicarle que pruebe otra cosa.
Para detener el agente mientras funciona, haga clic en el
El Agente puede crear nuevas celdas de cuaderno (o consultas), generar texto y código, ejecutar las celdas del cuaderno y acceder a la salida de la celda para interpretar los resultados.
Nota:
Para que data Science Agent continúe con su trabajo y siga los pasos siguientes, debe mantenerse en la pestaña actual en la que trabaja el agente.
Casos de uso
En el modo Agente, el Asistente tiene funcionalidades expandidas, como buscar datos, interpretar salidas y realizar acciones de celda.
Data Science Agent puede ayudar con tareas complejas de ciencia de datos, incluido el análisis exploratorio de datos, la previsión y el aprendizaje automático. Incluso puede usar la creación de un cuaderno de análisis de datos desde cero con Data Science Agent. Para obtener mejores resultados, proporcione al agente contexto haciendo referencia a tablas y canalizaciones con @<resource_name>. También puede hacer clic en Haga referencia a los recursos para seleccionar manualmente el contexto que se va a proporcionar.
Pruebe las siguientes indicaciones para empezar:
-
Detección de datos:
- "¿Qué tabla contiene datos de transacción bakehouse?"
- "Quiero ver los datos meteorológicos de la fecha 2025-01-01 en la ciudad de Los Ángeles, CA".
- "Encuentra una tabla que contiene los datos de taxi de la ciudad de Nueva York y me muestra las primeras 10 filas".
-
Análisis de datos exploratorios:
- "Ayúdame a analizar la cadena JSON en la columna A".
- "Cree una visualización de los datos de esta tabla".
- "Interprete este gráfico de barras."
- "Describir el conjunto de
@sales_transactionsdatos. Realice algún EDA para ayudarme a comprender las estadísticas de columna y visualizar la distribución de valores. Piense como un científico de datos". - "Analice
@workload_insightspara encontrar los cinco principales clientes de las cargas de trabajo de Databricks SQL la semana pasada por ingresos. A continuación, trazar cuántos usuarios tenían esos clientes para Databricks SQL por semana durante las últimas 6 semanas".
-
Previsión:
- "Con el
@incidentsconjunto de datos, cree una previsión del número diario de incidentes durante las próximas 2 semanas. Cuando haya terminado, dame una tabla de datos y un gráfico interactivo para mostrar los resultados". - "Con el conjunto de
@website_trafficdatos, prediga los recuentos diarios de visitantes para el próximo mes. Resalte los patrones estacionales". - "Genere una previsión de la demanda de productos durante los próximos 6 meses a partir del
@inventoryconjunto de datos, incluidos los intervalos de confianza".
- "Con el
-
Aprendizaje automático:
- "Realice algunas preparación de datos e ingeniería de características para preparar este conjunto de datos para el entrenamiento del modelo".
- "Entrenamiento de un modelo de clasificación en el
@customer_dataconjunto de datos para predecir la renovación. Evalúe el modelo con precisión y métricas de AUC". - "Realice el ajuste de hiperparámetros en un modelo de regresión mediante el conjunto de datos para mejorar el
@housing_priceserror de predicción". - "Cree un modelo de agrupación en clústeres en el
@sales_leadsconjunto de datos para identificar los segmentos del cliente y proporcione un resumen de las características de cada clúster".
-
Organización del cuaderno:
- "Cree una nueva celda que resuma los resultados de este cuaderno".
- "Asigne a este cuaderno un nombre relevante".
Análisis de datos exploratorios
Use Data Science Agent para realizar análisis exploratorios de datos en un conjunto de datos. Por ejemplo, pruebe a usar el agente para ayudarle a crear un cuaderno que analice el samples.bakehouse.sales_transactions conjunto de datos.
En una pestaña de cuaderno vacía, abra el panel Asistente, seleccione modo de agente y escriba el siguiente símbolo del sistema: "Describa el conjunto de datos desde @sales_transactions samples.bakehouse. Quiero hacer algún EDA para que pueda comprender las estadísticas de columna y visualizar la distribución de valores. Piense como un científico de datos".
El agente crea un plan para responder a la pregunta y podría formular preguntas aclarando. Con la aprobación, genera nuevas celdas de cuaderno que incluyen código para explorar los datos y el texto que explica su proceso y sus hallazgos.