Använda Textanalys för Azure AI Language i Fabric med REST API och SynapseML (förhandsversion)

Viktig

Den här funktionen finns i förhandsversion.

Azure AI Language är en Azure AI-tjänst som gör att du kan utföra textutvinning och textanalys med NLP-funktioner (Natural Language Processing).

I den här artikeln får du lära dig hur du använder Azure AI Language-tjänster direkt i Microsoft Fabric för att analysera text. I slutet av den här artikeln kan du:

Identifiera sentimentetiketter på menings- eller dokumentnivå
Identifiera språket för en viss textinmatning
Extrahera nyckelfraser från en text
Identifiera olika entiteter i text och kategorisera dem i fördefinierade klasser eller typer

Förutsättningar

Skaffa en Microsoft Fabric-prenumeration. Eller registrera dig för en kostnadsfri utvärderingsversion av Microsoft Fabric.
Logga in på Microsoft Fabric.
Växla till Fabric genom att använda upplevelseväxlaren längst ned till vänster på startsidan.

Skapa en ny anteckningsbok.
Anslut din anteckningsbok till ett lakehouse. Till vänster i anteckningsboken väljer du Lägg till för att lägga till ett befintligt lakehouse eller skapa ett nytt.

Anmärkning

Den här artikeln använder Microsoft Fabrics inbyggda fördefinierade AI-tjänster, som hanterar autentisering automatiskt. Du behöver inte skaffa en separat Azure AI-tjänstnyckel – autentiseringen hanteras via din Fabric-arbetsyta. Mer information finns i Förhandsbyggda AI-modeller i Fabric (förhandsversion).

Kodexemplen i den här artikeln använder bibliotek som är förinstallerade i Microsoft Fabric-notebook-filer:

SynapseML: Förinstallerat i Fabric Notebooks för maskininlärningsfunktioner
PySpark: Tillgänglig som standard i Fabric Spark-beräkning
Python-standardbibliotek: json, uuid ingår i Python-standardbiblioteket

Anmärkning

Microsoft Fabric-notebook-filer levereras med många vanliga bibliotek förinstallerade. SynapseML-biblioteket, som tillhandahåller funktionerna för MLflow-integrering och textanalys, är automatiskt tillgängligt i Spark-miljön.

Välj din metod

Den här artikeln innehåller två sätt att använda Azure AI Language-tjänster i Fabric:

REST API-metod: Dirigera HTTP-anrop till tjänsten (rekommenderas för nybörjare)
SynapseML-metod: Använda Spark DataFrames för bearbetning i större skala

Tips/Råd

Nya användare bör börja med REST API-metoden eftersom det är lättare att förstå och felsöka. SynapseML-metoden är bättre för bearbetning av stora datamängder med Spark.

Rest API (Gränssnitt för programmering av applikationer)
SynapseML

Konfigurera autentisering och slutpunkter

Kopiera och klistra in den här koden i den första cellen i din Fabric-anteckningsbok för att konfigurera anslutningen till Azure AI Language-tjänster:

Anmärkning

Den här koden använder Fabrics inbyggda autentisering. Funktionen get_fabric_env_config hämtar automatiskt dina autentiseringsuppgifter för arbetsytan och ansluter till de fördefinierade AI-tjänsterna. Ingen API-nyckel krävs.

# Get workload endpoints and access token
from synapse.ml.fabric.service_discovery import get_fabric_env_config
from synapse.ml.fabric.token_utils import TokenUtils
import json
import requests

fabric_env_config = get_fabric_env_config().fabric_env_config
auth_header = TokenUtils().get_openai_auth_header()

# Make a RESful request to AI service
prebuilt_AI_base_host = fabric_env_config.ml_workload_endpoint + "cognitive/textanalytics/"
print("Workload endpoint for AI service: \n" + prebuilt_AI_base_host)

service_url = prebuilt_AI_base_host + "language/:analyze-text?api-version=2022-05-01"
print("Service URL: \n" + service_url)

auth_headers = {
    "Authorization" : auth_header
}

def print_response(response):
    if response.status_code == 200:
        print(json.dumps(response.json(), indent=2))
    else:
        print(f"Error: {response.status_code}, {response.content}")

Importera nödvändiga bibliotek

Kopiera och klistra in den här koden i den första cellen i din Fabric-anteckningsbok:

import synapse.ml.core
from synapse.ml.cognitive.language import AnalyzeText
from pyspark.sql.functions import col

# Note: 'spark' and 'display()' are automatically available in Fabric notebooks

Sentimentanalys

Rest API (Gränssnitt för programmering av applikationer)
SynapseML

Funktionen Attitydanalys är ett sätt att identifiera sentimentetiketterna (till exempel "negativa", "neutrala" och "positiva") och konfidenspoäng på menings- och dokumentnivå. Den här funktionen returnerar även konfidenspoäng mellan 0 och 1 för varje dokument och meningar i det för positiva, neutrala och negativa sentiment. Se stöd för attitydanalys och åsiktsutvinningsspråk för listan över aktiverade språk.

Analysera attityd för text

Kopiera den här koden till en ny cell i anteckningsboken för att analysera attityden i en exempeltext:

payload = {
    "kind": "SentimentAnalysis",
    "parameters": {
        "modelVersion": "latest",
        "opinionMining": "True"
    },
    "analysisInput":{
        "documents":[
            {
                "id":"1",
                "language":"en",
                "text": "The food and service were unacceptable. The concierge was nice, however."
            }
        ]
    }
} 

response = requests.post(service_url, json=payload, headers=auth_headers)


# Output all information of the request process
print_response(response)

Tips/Råd

Du kan ersätta texten i fältet "text" med ditt eget innehåll som ska analyseras. Tjänsten returnerar sentimentpoäng och identifierar vilka delar av texten som är positiva, negativa eller neutrala.

Förväntad utdata

När du kör följande kod bör du se utdata som liknar följande:

{
  "kind": "SentimentAnalysisResults",
  "results": {
    "documents": [
      {
        "id": "1",
        "sentiment": "negative",
        "confidenceScores": {
          "positive": 0.0,
          "neutral": 0.0,
          "negative": 1.0
        },
        "sentences": [
          {
            "sentiment": "negative",
            "confidenceScores": {
              "positive": 0.0,
              "neutral": 0.0,
              "negative": 1.0
            },
            "offset": 0,
            "length": 40,
            "text": "The food and service were unacceptable. ",
            "targets": [
              {
                "sentiment": "negative",
                "confidenceScores": {
                  "positive": 0.01,
                  "negative": 0.99
                },
                "offset": 4,
                "length": 4,
                "text": "food",
                "relations": [
                  {
                    "relationType": "assessment",
                    "ref": "#/documents/0/sentences/0/assessments/0"
                  }
                ]
              },
              {
                "sentiment": "negative",
                "confidenceScores": {
                  "positive": 0.01,
                  "negative": 0.99
                },
                "offset": 13,
                "length": 7,
                "text": "service",
                "relations": [
                  {
                    "relationType": "assessment",
                    "ref": "#/documents/0/sentences/0/assessments/0"
                  }
                ]
              }
            ],
            "assessments": [
              {
                "sentiment": "negative",
                "confidenceScores": {
                  "positive": 0.01,
                  "negative": 0.99
                },
                "offset": 26,
                "length": 12,
                "text": "unacceptable",
                "isNegated": false
              }
            ]
          },
          {
            "sentiment": "neutral",
            "confidenceScores": {
              "positive": 0.22,
              "neutral": 0.75,
              "negative": 0.04
            },
            "offset": 40,
            "length": 32,
            "text": "The concierge was nice, however.",
            "targets": [
              {
                "sentiment": "positive",
                "confidenceScores": {
                  "positive": 1.0,
                  "negative": 0.0
                },
                "offset": 44,
                "length": 9,
                "text": "concierge",
                "relations": [
                  {
                    "relationType": "assessment",
                    "ref": "#/documents/0/sentences/1/assessments/0"
                  }
                ]
              }
            ],
            "assessments": [
              {
                "sentiment": "positive",
                "confidenceScores": {
                  "positive": 1.0,
                  "negative": 0.0
                },
                "offset": 58,
                "length": 4,
                "text": "nice",
                "isNegated": false
              }
            ]
          }
        ],
        "warnings": []
      }
    ],
    "errors": [],
    "modelVersion": "2025-01-01"
  }
}

Funktionen Attitydanalys är ett sätt att identifiera sentimentetiketterna (till exempel "negativa", "neutrala" och "positiva") och konfidenspoäng på menings- och dokumentnivå. Den här funktionen returnerar även konfidenspoäng mellan 0 och 1 för varje dokument och meningar i den för positiva, neutrala och negativa sentiment. Se stöd för attitydanalys och åsiktsutvinningsspråk för listan över aktiverade språk.

df = spark.createDataFrame([
    ("Great atmosphere. Close to plenty of restaurants, hotels, and transit! Staff are friendly and helpful.",),
    ("What a sad story!",)
], ["text"])

model = (AnalyzeText()
        .setTextCol("text")
        .setKind("SentimentAnalysis")
        .setOutputCol("response"))

result = model.transform(df)\
        .withColumn("documents", col("response.documents"))\
        .withColumn("sentiment", col("documents.sentiment"))

display(result.select("text", "sentiment"))

Språkdetektor

Rest API (Gränssnitt för programmering av applikationer)
SynapseML

Språkidentifieringen utvärderar textindata för varje dokument och returnerar språkidentifierare med en poäng som anger analysens styrka. Den här funktionen är användbar för innehållslager som samlar in godtycklig text, där språket är okänt. Se språk som stöds för språkidentifiering för listan över aktiverade språk.

payload = {
    "kind": "LanguageDetection",
    "parameters": {
        "modelVersion": "latest"
    },
    "analysisInput":{
        "documents":[
            {
                "id":"1",
                "text": "This is a document written in English."
            }
        ]
    }
}

response = requests.post(service_url, json=payload, headers=auth_headers)

# Output all information of the request process
print_response(response)

Utdata

{
  "kind": "LanguageDetectionResults",
  "results": {
    "documents": [
      {
        "id": "1",
        "warnings": [],
        "detectedLanguage": {
          "name": "English",
          "iso6391Name": "en",
          "confidenceScore": 0.95
        }
      }
    ],
    "errors": [],
    "modelVersion": "2024-11-01"
  }
}

df = spark.createDataFrame([
    (["Hello world"],),
    (["Bonjour tout le monde", "Hola mundo", "Tumhara naam kya hai?"],),
    (["你好"],),
    (["日本国（にほんこく、にっぽんこく、英"],)
], ["text"])

model = (AnalyzeText()
        .setTextCol("text")
        .setKind("LanguageDetection")
        .setOutputCol("response"))

result = model.transform(df)\
        .withColumn("documents", col("response.documents"))\
        .withColumn("detectedLanguage", col("documents.detectedLanguage.name"))

display(result.select("text", "detectedLanguage"))

Extraktor för nyckelfras

Rest API (Gränssnitt för programmering av applikationer)
SynapseML

Extrahering av nyckelfras utvärderar ostrukturerad text och returnerar en lista med nyckelfraser. Den här funktionen är användbar om du snabbt behöver identifiera huvudpunkterna i en samling dokument. Se språk som stöds för extrahering av nyckelfraser för listan över aktiverade språk.

payload = {
    "kind": "KeyPhraseExtraction",
    "parameters": {
        "modelVersion": "latest"
    },
    "analysisInput":{
        "documents":[
            {
                "id":"1",
                "language":"en",
                "text": "Dr. Smith has a very modern medical office, and she has great staff."
            }
        ]
    }
}

response = requests.post(service_url, json=payload, headers=auth_headers)

# Output all information of the request process
print_response(response)

Utdata

{
  "kind": "KeyPhraseExtractionResults",
  "results": {
    "documents": [
      {
        "id": "1",
        "keyPhrases": [
          "modern medical office",
          "Dr. Smith",
          "great staff"
        ],
        "warnings": []
      }
    ],
    "errors": [],
    "modelVersion": "2022-10-01"
  }
}

df = spark.createDataFrame([
    ("en", "Microsoft was founded by Bill Gates and Paul Allen."),
    ("en", "Text Analytics is one of the Azure Cognitive Services."),
    ("en", "My cat might need to see a veterinarian.")
], ["language", "text"])

model = (AnalyzeText()
        .setTextCol("text")
        .setKind("KeyPhraseExtraction")
        .setOutputCol("response"))

result = model.transform(df)\
        .withColumn("documents", col("response.documents"))\
        .withColumn("keyPhrases", col("documents.keyPhrases"))

display(result.select("text", "keyPhrases"))

Namngiven entitetsigenkänning (NER)

Rest API (Gränssnitt för programmering av applikationer)
SynapseML

Erkännande av namngivna entiteter (NER) är förmågan att identifiera olika entiteter i text och kategorisera dem i fördefinierade klasser eller typer som: person, plats, händelse, produkt och organisation. Se NER-språkstöd för listan över aktiverade språk.

payload = {
    "kind": "EntityRecognition",
    "parameters": {
        "modelVersion": "latest"
    },
    "analysisInput":{
        "documents":[
            {
                "id":"1",
                "language": "en",
                "text": "I had a wonderful trip to Seattle last week."
            }
        ]
    }
}

response = requests.post(service_url, json=payload, headers=auth_headers)

# Output all information of the request process
print_response(response)

Utdata

{
  "kind": "EntityRecognitionResults",
  "results": {
    "documents": [
      {
        "id": "1",
        "entities": [
          {
            "text": "trip",
            "category": "Event",
            "offset": 18,
            "length": 4,
            "confidenceScore": 0.66
          },
          {
            "text": "Seattle",
            "category": "Location",
            "subcategory": "City",
            "offset": 26,
            "length": 7,
            "confidenceScore": 1.0
          },
          {
            "text": "last week",
            "category": "DateTime",
            "subcategory": "DateRange",
            "offset": 34,
            "length": 9,
            "confidenceScore": 1.0
          }
        ],
        "warnings": []
      }
    ],
    "errors": [],
    "modelVersion": "2025-02-01"
  }
}

df = spark.createDataFrame([
    ("en", "Microsoft was founded by Bill Gates and Paul Allen."),
    ("en", "Pike place market is my favorite Seattle attraction.")
], ["language", "text"])

model = (AnalyzeText()
        .setTextCol("text")
        .setKind("EntityRecognition")
        .setOutputCol("response"))

result = model.transform(df)\
        .withColumn("documents", col("response.documents"))\
        .withColumn("entityNames", col("documents.entities.text"))

display(result.select("text", "entityNames"))

Entitetslänkning

Rest API (Gränssnitt för programmering av applikationer)
SynapseML

Inga steg för REST API i det här avsnittet.

Entitetslänkning identifierar och särskiljer identiteten för entiteter som finns i text. Till exempel i meningen "Vi åkte till Seattle förra veckan.", skulle ordet "Seattle" identifieras, med en länk till mer information på Wikipedia. Se språk som stöds för entitetslänkning för listan över aktiverade språk.

df = spark.createDataFrame([
    ("en", "Microsoft was founded by Bill Gates and Paul Allen."),
    ("en", "Pike place market is my favorite Seattle attraction.")
], ["language", "text"])

model = (AnalyzeText()
        .setTextCol("text")
        .setKind("EntityLinking")
        .setOutputCol("response"))

result = model.transform(df)\
        .withColumn("documents", col("response.documents"))\
        .withColumn("entityNames", col("documents.entities.name"))

display(result)

Använd fördefinierad textanalys i Fabric med SynapseML
Använd fördefinierade Azure AI Translator i Fabric med REST API
Använd förbyggda Azure AI Translator i Fabric med SynapseML
Använd förbyggda Azure OpenAI-konfigurationer i Fabric med REST API
Använda fördefinierade Azure OpenAI i Fabric med Python SDK
Använd förbyggda Azure OpenAI på Fabric med SynapseML
SynapseML GitHub-lagringsplats – Källkod och dokumentation för SynapseML
Dokumentation om Azure AI Language – Fullständig referens för Azure AI Language-tjänsten

Feedback

Var den här sidan hjälpsam?

Last updated on 2025-08-20

Dela via

Använda Textanalys för Azure AI Language i Fabric med REST API och SynapseML (förhandsversion)

Förutsättningar

Välj din metod

Konfigurera autentisering och slutpunkter

Sentimentanalys

Analysera attityd för text

Förväntad utdata

Språkdetektor

Utdata

Extraktor för nyckelfras

Utdata

Namngiven entitetsigenkänning (NER)

Utdata

Entitetslänkning

Relaterat innehåll

Feedback

Ytterligare resurser