Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Importante
Questa funzionalità è in versione beta.
Questa pagina presenta l'agente di data science, un agente dati di intelligenza artificiale disponibile selezionando Modalità agente in Databricks Assistant. Progettato specificamente per i notebook di Databricks e l'editor SQL, esplora i dati, genera ed esegue il codice e corregge gli errori, tutti da un singolo prompt.
Che cos'è l'agente di data science?
Data Science Agent è una potente funzionalità nella modalità agente di Databricks Assistant che trasforma l'Assistente in un complementare intelligente in grado di automatizzare interi flussi di lavoro di data science in più passaggi nei notebook di Databricks e nell'editor SQL.
Rispetto alla modalità Chat assistente, la modalità agente ha ampliato le funzionalità: pianificazione di una soluzione, recupero di asset pertinenti, esecuzione di codice, uso di output delle celle per migliorare i risultati, correggere automaticamente gli errori e altro ancora.
Data Science Agent può pianificare e generare codice da eseguire in notebook o query da eseguire nell'editor SQL. L'agente collabora con l'utente per approvare i piani e confermare i passaggi successivi prima di procedere. Con l'approvazione, l'agente di data science può usare strumenti per eseguire attività come la ricerca di tabelle, la modifica di un notebook, l'esecuzione di celle e la lettura degli output delle celle.
L'accesso e le azioni dell'agente di data science sono regolati dalle autorizzazioni dell'utente. Può accedere solo ai dati a cui si ha accesso ed eseguire operazioni per cui si dispone delle autorizzazioni.
Requisiti
Per usare l'agente di data science, l'area di lavoro richiede quanto segue:
- Funzionalità di intelligenza artificiale basate su partner abilitate sia per l'account che per l'area di lavoro. Consulta Funzionalità di AI supportate da partner.
- Anteprima di Data Science Agent abilitata. Vedere Gestire le anteprime di Azure Databricks.
Usare l'agente di data science
Per usare l'agente di data science:
Da un notebook di Databricks o dall'editor SQL aprire il pannello laterale Assistente.
Nell'angolo in basso a destra selezionare Agente. Questa opzione attiva o disattiva la modalità agente dell'assistente, consentendo di interagire con l'agente di data science.
Immettere un prompt per l'agente. Ad esempio, "Analizza
@sales_transactionsda samples.bakehouse per identificare il prodotto più venduto".Suggerimento
Fare riferimento a tabelle specifiche tramite
@table_name. L'agente userà tale tabella e tutti i metadati associati per curare la risposta. L'agente rispetta le autorizzazioni del catalogo Unity dell'utente, in modo che possa accedere solo ai dati a cui si ha accesso.Quando l'agente genera la risposta, spesso si sospende per ottenere l'input:
Per attività più complesse, l'agente può creare un piano dettagliato e porre domande chiare. Rispondere alle domande di chiarimento dell'agente per aiutarlo a perfezionare il piano.
Quando l'agente deve eseguire il codice, richiede l'approvazione prima di procedere. Consenti o Rifiuta la richiesta. È anche possibile selezionare Consenti in questo thread (facendo riferimento al thread di conversazione assistente) o Consenti sempre.
Importante
L'agente di data science può generare ed eseguire codice nel notebook. Mentre ha guardrail per prevenire azioni pericolose, c'è ancora rischio. È consigliabile usarlo solo con codice e dati attendibili
Quando l'agente continua il proprio lavoro, potrebbe essere richiesto di selezionare Continua o Rifiuta. Esaminare il lavoro esistente dell'agente, quindi selezionare Continua per consentire all'agente di continuare con i passaggi successivi o Rifiuta per indicare di provare qualcos'altro.
Per arrestare l'agente mentre funziona, fare clic
Agent può creare nuove celle del notebook (o query), generare testo e codice, eseguire le celle del notebook e accedere all'output della cella per interpretare i risultati.
Annotazioni
Per consentire all'agente di data science di continuare il proprio lavoro ed eseguire i passaggi successivi, è necessario rimanere nella scheda corrente in cui funziona l'agente.
Casi d'uso
In modalità agente l'Assistente dispone di funzionalità espanse, ad esempio la ricerca di dati, l'interpretazione degli output e l'esecuzione di azioni delle celle.
L'agente di data science può essere utile per attività di data science complesse, tra cui l'analisi esplorativa dei dati, la previsione e l'apprendimento automatico. È anche possibile usare la creazione di un nuovo notebook di analisi dei dati da zero con l'agente di data science. Per ottenere risultati migliori, fornire all'agente il contesto facendo riferimento a tabelle e pipeline con @<resource_name>. È anche possibile fare clic
Provare le istruzioni seguenti per iniziare:
-
Individuazione dati:
- "Quale tabella contiene i dati delle transazioni bakehouse?"
- "Voglio vedere i dati meteo per la data 2025-01-01 nella città di Los Angeles, CA."
- "Trovare una tabella contenente i dati dei taxi di New York City e visualizzare le prime 10 righe".
-
Analisi esplorativa dei dati:
- "Aiutami ad analizzare la stringa JSON nella colonna A".
- "Creare una visualizzazione dei dati da questa tabella".
- "Interpretare questo grafico a barre".
- "Descrivere il
@sales_transactionsset di dati. Eseguire alcune operazioni EDA per comprendere le statistiche delle colonne e visualizzare la distribuzione dei valori. Pensa come un data scientist." - "Analizzare
@workload_insightsper trovare i primi 5 clienti per i carichi di lavoro di Databricks SQL della scorsa settimana in base ai ricavi. Tracciare quindi quanti utenti avevano per Databricks SQL alla settimana per le ultime 6 settimane".
-
Previsione:
- "Usando il
@incidentsset di dati, creare una previsione del numero giornaliero di eventi imprevisti per le prossime 2 settimane. Al termine, assegnare una tabella dati e un grafico interattivo per visualizzare i risultati." - "Usando il
@website_trafficset di dati, stimare i conteggi dei visitatori giornalieri per il mese successivo. Evidenziare qualsiasi modello stagionale." - "Generare una previsione della domanda di prodotto per i prossimi 6 mesi dal
@inventoryset di dati, inclusi gli intervalli di confidenza".
- "Usando il
-
Machine Learning:
- "Eseguire alcune attività di preparazione dei dati e progettazione di funzionalità per preparare questo set di dati per il training del modello".
- "Eseguire il training di un modello di classificazione nel set di dati per stimare la
@customer_datavarianza. Valutare il modello con la precisione e le metriche AUC." - "Eseguire l'ottimizzazione degli iperparametri su un modello di regressione usando il set di dati per migliorare l'errore
@housing_pricesdi stima". - "Creare un modello di clustering nel
@sales_leadsset di dati per identificare i segmenti dei clienti e fornire un riepilogo delle caratteristiche di ogni cluster".
-
Organizzazione notebook:
- "Creare una nuova cella che riepiloga i risultati di questo notebook".
- "Assegnare a questo notebook un nome pertinente".
Analisi esplorativa dei dati
Usare l'agente di data science per eseguire l'analisi esplorativa dei dati in un set di dati. Ad esempio, provare a usare Agent per creare un nuovo notebook che analizza il samples.bakehouse.sales_transactions set di dati.
In una scheda notebook vuota aprire il pannello Assistente, selezionare Modalità agente e immettere il prompt seguente: "Descrivere il set di dati, @sales_transactions da samples.bakehouse. Si vuole eseguire alcune operazioni EDA in modo da comprendere le statistiche delle colonne e visualizzare la distribuzione dei valori. Pensa come un data scientist."
L'agente crea un piano per rispondere alla richiesta e potrebbe porre domande chiare. Con l'approvazione, genera nuove celle del notebook che includono codice per esplorare i dati e il testo che ne spiega il processo e i risultati.