Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
La ai.embed funzione usa l'intelligenza artificiale generativa per convertire il testo in incorporamenti vettoriali. Questi vettori consentono all'intelligenza artificiale di comprendere le relazioni tra testi, in modo da poter cercare, raggruppare e confrontare il contenuto in base al significato anziché alla formulazione esatta. Con una singola riga di codice, è possibile generare incorporamenti vettoriali da una colonna in un dataframe.
Annotazioni
- Questo articolo illustra l'uso di ai.embed con PySpark. Per usare ai.embed con pandas, vedere questo articolo.
- Vedere altre funzioni di intelligenza artificiale in questo articolo di panoramica.
- Informazioni su come personalizzare la configurazione delle funzioni di intelligenza artificiale.
Informazioni generali
La ai.embed funzione è disponibile per i dataframe Spark. È necessario specificare il nome di una colonna di input esistente come parametro.
La funzione restituisce un nuovo dataframe che include incorporamenti per ogni riga di testo di input, in una colonna di output.
Sintassi
df.ai.embed(input_col="col1", output_col="embed")
Parametri
| Nome | Description |
|---|---|
input_col Obbligatorio |
Stringa contenente il nome di una colonna esistente con valori di testo di input da usare per l'elaborazione degli incorporamenti. |
output_col Opzionale |
Stringa contenente il nome di una nuova colonna in cui archiviare gli incorporamenti calcolati per ogni riga di testo di input. Se non si imposta questo parametro, viene generato un nome predefinito per la colonna di output. |
error_col Opzionale |
Stringa contenente il nome di una nuova colonna che archivia eventuali errori OpenAI risultanti dall'elaborazione di ogni riga di testo di input. Se non si imposta questo parametro, viene generato un nome predefinito per la colonna di errore. Se una riga di input non contiene errori, questa colonna ha un null valore . |
Restituzioni
La funzione restituisce un dataframe Spark che include una nuova colonna contenente incorporamenti generati per ogni riga di testo di input. Gli incorporamenti sono di tipo [pyspark.ml.linalg.DenseVector])https://spark.apache.org/docs/latest/api/python/reference/api/pyspark.ml.linalg.DenseVector.html#densevector). Il numero di elementi in DenseVector dipende dalle dimensioni del modello di incorporamento, configurabili nelle funzioni di intelligenza artificiale
Example
# This code uses AI. Always review output for mistakes.
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.
df = spark.createDataFrame([
("This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",),
("Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",),
("Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!",)
], ["descriptions"])
embed = df.ai.embed(input_col="descriptions", output_col="embed")
display(embed)
Questa cella di codice di esempio fornisce l'output seguente:
Contenuti correlati
Usa ai.embed con pandas.
Rilevare il sentiment con ai.analyze_sentiment.
Classificare il testo con ai.classify.
Estrarre entità con ai_extract.
Correggere la grammatica con ai.fix_grammar.
Rispondere alle richieste dell'utente personalizzate con ai.generate_response.
Calcolare la somiglianza con ai.similarity.
Riepilogare il testo con ai.summarize.
Tradurre il testo con ai.translate.
Altre informazioni sul set completo di funzioni di intelligenza artificiale.
Personalizzare la configurazione delle funzioni di intelligenza artificiale.
Abbiamo perso una funzionalità necessaria? Suggeriscilo nel forum Fabric Ideas.