Megosztás a következőn keresztül:


Szöveg elemzése (REST API előzetes verziója)

A következővonatkozik: 2023-07-01-Preview. Ez a verzió már nem támogatott. Frissítés azonnal egy újabb verzióra.

Fontos

2023-07-01-Preview (nincs változás).

2021-04-30-Preview hozzáadja "normalizer", amely a kis- és nagybetűk érzéketlenségének tesztelésére és a szűrők és a rendezések szövegfeldolgozásának tesztelésére szolgál.

Az Analyze Text API bemutatja, hogyan törik fel az elemzők a szövegeket jogkivonatokká, és hogyan dolgozza fel a normalizáló a szöveget. Interaktív tesztelésre szolgál, hogy hibakeresés céljából kiértékelhesse az adott elemzőt vagy normalizálót.

POST https://[service name].search.windows.net/indexes/[index name]/analyze?api-version=[api-version]
    Content-Type: application/json
    api-key: [admin key]

Az elemző vagy normalizáló tesztelése önálló feladat. Ha elemzőt vagy normalizálót használ az indexelés vagy a lekérdezés végrehajtása során, akkor azt Index létrehozása vagy frissítése egyes mezőkben adja meg.

URI-paraméterek

Paraméter Leírás
szolgáltatásnév Szükséges. A keresési szolgáltatás neve.
index neve Szükséges. Az elemezni kívánt mezőt tartalmazó index neve.
api-verzió Szükséges. A teljes lista API-verziók.

Kérelemfejlécek

Az alábbi táblázat a szükséges és nem kötelező kérelemfejléceket ismerteti.

Mezők Leírás
Tartalomtípus Szükséges. Állítsa be ezt a beállítást application/json
api-key Nem kötelező, ha Azure-szerepköröket használ, és egy tulajdonosi jogkivonatot ad meg a kéréshez, ellenkező esetben kulcsra van szükség. Az API-kulcs egy egyedi, rendszer által generált sztring, amely hitelesíti a keresési szolgáltatásnak küldött kérést. Az elemzőkéréseknek tartalmazniuk kell egy api-key fejléckészletet a rendszergazdai kulcshoz (szemben a lekérdezési kulccsal). A részletekért lásd: Csatlakozás az Azure AI Search szolgáltatáshoz kulcshitelesítési használatával.

Kérelem törzse

{
  "text": "Text to analyze",
  "analyzer": "analyzer_name"
}

vagy

{
  "text": "Text to analyze",
  "tokenizer": "tokenizer_name",
  "tokenFilters": (optional) [ "token_filter_name" ],
  "charFilters": (optional) [ "char_filter_name" ]
}

vagy

{
  "text": "Text to normalize",
  "normalizer": "normalizer_name"
}

A kérelem a következő tulajdonságokat tartalmazza:

Ingatlan Leírás
SMS Szükséges. Az elemezni vagy normalizálni kívánt szöveg.
elemző A szöveg jogkivonatokra való feltöréséhez használt elemző. Ez a tulajdonság egy beépített elemzőneve, egy nyelvelemzőneve, vagy az indexdefinícióban egyéni elemző neve. A lexikális elemzés folyamatával kapcsolatos további információkért lásd: Elemzés az Azure AI Search.
tokenizer A szöveg jogkivonatokra bontásához használt jogkivonat-szabályzó. Ez a tulajdonság egy előre definiált tokenizer vagy egy egyéni tokenizer neve az indexdefinícióban.
tokenFilters A szöveg feldolgozásához használt jogkivonatszűrők gyűjteménye. A gyűjtemény értékeinek előre definiált jogkivonatszűrők vagy az indexdefinícióban szereplő egyéni jogkivonat-szűrők neveinek kell lenniük. A tesztelési elemzők esetében ezt a tulajdonságot a tokenizer tulajdonság mellett kell használni. A normalizálók teszteléséhez ez a tulajdonság egymástól függetlenül is használható.
charFilters A szöveg feldolgozásához használt karakterszűrők gyűjteménye. A gyűjtemény értékeinek előre definiált karakterszűrők neveinek vagy az indexdefiníció egyéni karakterszűrőinek neveinek kell lenniük. A tesztelési elemzők esetében ezt a tulajdonságot a tokenizer tulajdonság mellett kell használni. A normalizálók teszteléséhez ez a tulajdonság egymástól függetlenül is használható.
Normalizáló A szöveg feldolgozásához használt normalizáló. Ez a tulajdonság egy előre definiált normalizáló vagy egyéni normalizáló neve az indexdefinícióban. A normalizálókkal kapcsolatos további információkért lásd: Szöveg normalizálása a szűréshez, az arcfelismeréshez és a rendezéshez.

Válasz

Állapotkód: A rendszer a sikeres válaszhoz 200 OK-t ad vissza.

A válasz törzse a következő formátumban van:

    {
      "tokens": [
        {
          "token": string (token),
          "startOffset": number (index of the first character of the token),
          "endOffset": number (index of the last character of the token),
          "position": number (position of the token in the input text)
        },
        ...
      ]
    }

Példák

A kérelem törzse tartalmazza a használni kívánt sztringet és elemzőt vagy normalizálót.

     {
       "text": "The quick brown fox",
       "analyzer": "standard"
     }

A válasz az elemző által a megadott sztringhez kibocsátott jogkivonatokat jeleníti meg.

{
    "tokens": [
        {
            "token": "the",
            "startOffset": 0,
            "endOffset": 3,
            "position": 0
        },
        {
            "token": "quick",
            "startOffset": 4,
            "endOffset": 9,
            "position": 1
        },
        {
            "token": "brown",
            "startOffset": 10,
            "endOffset": 15,
            "position": 2
        },
        {
            "token": "fox",
            "startOffset": 16,
            "endOffset": 19,
            "position": 3
        }
    ]
}

Lásd még: