Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
La ai.extract funzione usa l'intelligenza artificiale generativa per analizzare il testo di input ed estrarre tipi specifici di informazioni designate dalle etichette scelte, ad esempio posizioni o nomi. Usa solo una singola riga di codice.
Annotazioni
- Questo articolo illustra l'uso di ai.extract con pandas. Per usare ai.extract con PySpark, vedere questo articolo.
- Vedere altre funzioni di intelligenza artificiale in questo articolo di panoramica.
- Informazioni su come personalizzare la configurazione delle funzioni di intelligenza artificiale.
Informazioni generali
La ai.extract funzione estende la classe Pandas Series . Per estrarre tipi di entità personalizzati da ogni riga di input, chiamare la funzione in una colonna di testo Pandas DataFrame .
A differenza di altre funzioni di intelligenza artificiale, ai.extract restituisce un dataframe pandas, invece di una serie, con una colonna separata per ogni tipo di entità specificato che contiene valori estratti per ogni riga di input.
Sintassi
df_entities = df["text"].ai.extract("entity1", "entity2", "entity3")
Parametri
| Nome | Description |
|---|---|
labels Obbligatorio |
Una o più stringhe che rappresentano il set di tipi di entità da estrarre dai valori di testo di input. |
aifunc.ExtractLabel Opzionale |
Una o più definizioni di etichetta che descrivono i campi da estrarre. Per ulteriori informazioni, vedere la tabella Parametri ExtractLabel. |
Parametri di ExtractLabel
| Nome | Description |
|---|---|
label Obbligatorio |
Stringa che rappresenta l'entità da estrarre dai valori di testo di input. |
description Opzionale |
Stringa che aggiunge un contesto aggiuntivo per il modello di intelligenza artificiale. Può includere requisiti, contesto o istruzioni per l'intelligenza artificiale da considerare durante l'esecuzione dell'estrazione. |
max_items Opzionale |
Valore int che specifica il numero massimo di elementi da estrarre per questa etichetta. |
type Opzionale |
Tipo di schema JSON per il valore estratto. I tipi supportati per questa classe includono string, numberinteger, boolean, , objecte array. |
properties Opzionale |
Altre proprietà dello schema JSON per il tipo come dizionario. Può includere proprietà supportate come "items" per array, "proprietà" per oggetti, "enum" per i tipi enumerati e altro ancora. Vedere l'utilizzo di esempio in questo articolo. |
raw_col Opzionale |
Stringa che imposta il nome della colonna per la risposta LLM non elaborata. La risposta non elaborata fornisce un elenco di coppie di dizionario per ogni etichetta di entità, tra cui "reason" e "extraction_text". |
Restituzioni
La funzione restituisce un dataframe pandas con una colonna per ogni tipo di entità specificato. La colonna o le colonne contengono le entità estratte per ogni riga di testo di input. Se la funzione identifica più corrispondenze per un'entità, restituisce solo una di queste corrispondenze. Se non viene trovata alcuna corrispondenza, il risultato è null.
Il tipo restituito predefinito è un elenco di stringhe per ogni etichetta. Se gli utenti scelgono di specificare un tipo diverso nella aifunc.ExtractLabel configurazione, ad esempio "type=integer", l'output sarà un elenco di python int. Se gli utenti specificano "max_items=1" nella aifunc.ExtractLabel configurazione, viene restituito solo un elemento del tipo per tale etichetta.
Example
# This code uses AI. Always review output for mistakes.
df = pd.DataFrame([
"MJ Lee lives in Tuscon, AZ, and works as a software engineer for Contoso.",
"Kris Turner, a nurse at NYU Langone, is a resident of Jersey City, New Jersey."
], columns=["descriptions"])
df_entities = df["descriptions"].ai.extract("name", "profession", "city")
display(df_entities)
Questa cella di codice di esempio fornisce l'output seguente:
Contenuti correlati
Usare ai.extract con PySpark.
Rilevare il sentiment con ai.analyze_sentiment.
Classificare il testo con ai.classify.
Generare incorporamenti vettoriali con ai.embed.
Correggere la grammatica con ai.fix_grammar.
Rispondere alle richieste dell'utente personalizzate con ai.generate_response.
Calcolare la somiglianza con ai.similarity.
Riepilogare il testo con ai.summarize.
Tradurre il testo con ai.translate.
Altre informazioni sul set completo di funzioni di intelligenza artificiale.
Personalizzare la configurazione delle funzioni di intelligenza artificiale.
Abbiamo perso una funzionalità necessaria? Suggeriscilo nel forum Fabric Ideas.