Dela via


Så här använder du namngiven entitetsigenkänning (NER)

FUNKTIONEN NER kan utvärdera ostrukturerad text och extrahera namngivna entiteter från text i flera fördefinierade kategorier, till exempel person, plats, händelse, produkt och organisation.

Utvecklingsalternativ

Om du vill använda namngiven entitetsigenkänning skickar du ostrukturerad ostrukturerad text för analys och hanterar API-utdata i ditt program. Analysen utförs som den är, utan ytterligare anpassning till den modell som används för dina data. Det finns två sätt att använda namngiven entitetsigenkänning:

Utvecklingsalternativ beskrivning
Language Studio Language Studio är en webbaserad plattform där du kan prova entitetslänkning med textexempel utan ett Azure-konto och dina egna data när du registrerar dig. Mer information finns på Language Studio-webbplatsen eller language studio-snabbstarten.
REST API eller klientbibliotek (Azure SDK) Integrera namngiven entitetsigenkänning i dina program med hjälp av REST-API:et eller klientbiblioteket som är tillgängligt på flera olika språk. Mer information finns i snabbstarten för namngiven entitetsigenkänning.

Bestämma hur data ska bearbetas (valfritt)

Indataspråk

När du skickar dokument som ska bearbetas kan du ange vilket av de språk som stöds som de är skrivna i. Om du inte anger något språk kan du som standard använda extrahering av nyckelfraser på engelska. API:et kan returnera förskjutningar i svaret för att stödja olika flerspråkiga kodningar och emojikodningar.

Skicka data

Analysen utförs när begäran har tagits emot. Användning av NER-funktionen är synkront tillståndslös. Inga data lagras i ditt konto och resultatet returneras omedelbart i svaret.

När du använder den här funktionen asynkront är API-resultaten tillgängliga i 24 timmar från den tidpunkt då begäran matades in och anges i svaret. Efter den här tidsperioden rensas resultaten och är inte längre tillgängliga för hämtning.

API:et försöker identifiera de definierade entitetskategorierna för ett visst dokumentspråk.

Hämta NER-resultat

När du får resultat från NER kan du strömma resultatet till ett program eller spara utdata till en fil i det lokala systemet. API-svaret innehåller identifierade entiteter, inklusive deras kategorier och underkategorier samt konfidenspoäng.

Välj vilka entiteter som ska returneras (endast API för förhandsversion)

Från och med API version 2023-04-15-preview försöker API:et identifiera de definierade entitetstyperna och taggarna för ett visst dokumentspråk. Entitetstyperna och taggarna ersätter de kategorier och underkategorier som de äldre modellerna använder för att definiera entiteter för mer flexibilitet. Du kan också ange vilka entiteter som identifieras och returneras, använda valfria includeList och excludeList parametrar med lämpliga entitetstyper. I följande exempel identifieras endast Location. Du kan ange en eller flera entitetstyper som ska returneras. Med tanke på den typ- och taggarhierarki som introducerades för den här versionen har du flexibiliteten att filtrera på olika kornighetsnivåer så här:

Inmatning:

Kommentar

I det här exemplet returneras endast entitetstypen Plats .

{
    "kind": "EntityRecognition",
    "parameters": 
    {
        "includeList" :
        [
            "Location"
        ]
    },
    "analysisInput":
    {
        "documents":
        [
            {
                "id":"1",
                "language": "en",
                "text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
            }
        ]
    }
}

Ovanstående exempel returnerar entiteter som faller under Location entitetstypen, till GPEexempel , Structuraloch Geological taggade entiteter enligt beskrivningen av entitetstyper och taggar. Vi kan också ytterligare filtrera de returnerade entiteterna genom att filtrera med någon av entitetstaggar för Location entitetstypen, till exempel filtrering över GPE tagg endast enligt beskrivningen:


    "parameters": 
    {
        "includeList" :
        [
            "GPE"
        ]
    }
    

Den här metoden returnerar alla Location entiteter som bara faller under taggen GPE och ignorerar alla andra entiteter som faller under den Location typ som taggas med andra entitetstagg som Structural eller Geological taggade entiteter Location . Vi kan också öka detaljnivån ytterligare på våra resultat med hjälp av parametern excludeList . GPEtaggade entiteter kan taggas med följande taggar: City, State, CountryRegion, . Continent Vi kan till exempel exkludera Continent och CountryRegion taggar för vårt exempel:


    "parameters": 
    {
        "includeList" :
        [
            "GPE"
        ],
        "excludeList": :
        [
            "Continent",
            "CountryRegion"
        ]
    }
    

Med hjälp av dessa parametrar kan vi bara Location filtrera på entitetstyper, eftersom GPE entitetstaggen som ingår i parametern includeList faller under Location typen. Sedan filtrerar vi endast på geopolitiska entiteter och exkluderar alla entiteter som taggats med Continent eller CountryRegion taggar.

Ange NER-modellen

Som standard använder den här funktionen den senaste tillgängliga AI-modellen i din text. Du kan också konfigurera dina API-begäranden att använda en specifik modellversion.

Tjänst- och datagränser

Information om storleken och antalet begäranden som du kan skicka per minut och sekund finns i artikeln om tjänstbegränsningar .

Nästa steg

Översikt över namngiven entitetsigenkänning