NER (Named Entity Recognition) gebruiken
De NER-functie kan ongestructureerde tekst evalueren en benoemde entiteiten extraheren uit tekst in verschillende vooraf gedefinieerde categorieën, bijvoorbeeld: persoon, locatie, gebeurtenis, product en organisatie.
Ontwikkelingsopties
Als u herkenning van benoemde entiteiten wilt gebruiken, verzendt u onbewerkte ongestructureerde tekst voor analyse en verwerkt u de API-uitvoer in uw toepassing. Analyse wordt uitgevoerd als zodanig, zonder extra aanpassingen aan het model dat op uw gegevens wordt gebruikt. Er zijn twee manieren om benoemde entiteitsherkenning te gebruiken:
Ontwikkelingsoptie | Beschrijving |
---|---|
Taalstudio | Language Studio is een webplatform waarmee u entiteitskoppelingen kunt proberen met tekstvoorbeelden zonder een Azure-account en uw eigen gegevens wanneer u zich aanmeldt. Zie de quickstart voor Language Studio of Language Studio voor meer informatie. |
REST API of clientbibliotheek (Azure SDK) | Integreer benoemde entiteitsherkenning in uw toepassingen met behulp van de REST API of de clientbibliotheek die beschikbaar is in verschillende talen. Zie de quickstart voor herkenning van benoemde entiteiten voor meer informatie. |
Bepalen hoe de gegevens moeten worden verwerkt (optioneel)
Invoertalen
Wanneer u documenten verzendt die moeten worden verwerkt, kunt u opgeven in welke van de ondersteunde talen ze zijn geschreven. Als u geen taal opgeeft, worden standaard sleuteltermextracties standaard ingesteld op Engels. De API retourneert mogelijk offsets in het antwoord ter ondersteuning van verschillende meertalige en emoji-coderingen.
Gegevens verzenden
Analyse wordt uitgevoerd na ontvangst van de aanvraag. Het gebruik van de NER-functie is synchroon staatloos. Er worden geen gegevens in uw account opgeslagen en de resultaten worden onmiddellijk in het antwoord geretourneerd.
Wanneer u deze functie asynchroon gebruikt, zijn de API-resultaten gedurende 24 uur beschikbaar vanaf het moment dat de aanvraag is opgenomen en wordt aangegeven in het antwoord. Na deze periode worden de resultaten opgeschoond en zijn ze niet meer beschikbaar voor het ophalen.
De API probeert de gedefinieerde entiteitscategorieën voor een bepaalde documenttaal te detecteren.
NER-resultaten ophalen
Wanneer u resultaten van NER krijgt, kunt u de resultaten streamen naar een toepassing of de uitvoer opslaan in een bestand op het lokale systeem. Het API-antwoord bevat herkende entiteiten, inclusief hun categorieën en subcategorieën en betrouwbaarheidsscores.
Selecteren welke entiteiten moeten worden geretourneerd (alleen preview-API)
Vanaf API-versie 2023-04-15-preview probeert de API de gedefinieerde entiteitstypen en tags voor een bepaalde documenttaal te detecteren. De entiteitstypen en tags vervangen de categorieën en subcategorieënstructuur die de oudere modellen gebruiken om entiteiten te definiëren voor meer flexibiliteit. U kunt ook opgeven welke entiteiten worden gedetecteerd en geretourneerd, de optionele includeList
en excludeList
parameters gebruiken met de juiste entiteitstypen. In het volgende voorbeeld wordt alleen Location
gedetecteerd. U kunt een of meer entiteitstypen opgeven die moeten worden geretourneerd. Gezien de typen en tagshiërarchie die voor deze versie is geïntroduceerd, hebt u de flexibiliteit om te filteren op verschillende granulariteitsniveaus als volgt:
Input:
Notitie
In dit voorbeeld wordt alleen het entiteitstype Locatie geretourneerd.
{
"kind": "EntityRecognition",
"parameters":
{
"includeList" :
[
"Location"
]
},
"analysisInput":
{
"documents":
[
{
"id":"1",
"language": "en",
"text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
}
]
}
}
In de bovenstaande voorbeelden worden entiteiten geretourneerd die onder het Location
entiteitstype vallen, zoals de GPE
, Structural
en Geological
gelabelde entiteiten, zoals beschreven door entiteitstypen en tags. We kunnen de geretourneerde entiteiten ook verder filteren door te filteren met behulp van een van de entiteitstags voor het Location
entiteitstype, zoals filteren op GPE
tag alleen zoals wordt beschreven:
"parameters":
{
"includeList" :
[
"GPE"
]
}
Deze methode retourneert alle Location
entiteiten die alleen onder de GPE
tag vallen en negeer alle andere entiteiten die onder het Location
type vallen dat is getagd met een andere entiteitstag, zoals Structural
of Geological
gelabelde Location
entiteiten. We kunnen ook verder inzoomen op onze resultaten met behulp van de excludeList
parameter. GPE
gelabelde entiteiten kunnen worden gelabeld met de volgende tags: City
, State
, CountryRegion
, . Continent
We kunnen bijvoorbeeld uitsluiten en CountryRegion
tags voor Continent
ons voorbeeld:
"parameters":
{
"includeList" :
[
"GPE"
],
"excludeList": :
[
"Continent",
"CountryRegion"
]
}
Met deze parameters kunnen we filteren op alleen Location
entiteitstypen, omdat de GPE
entiteitstag die in de includeList
parameter is opgenomen, onder het Location
type valt. Vervolgens filteren we op alleen geopolitieke entiteiten en sluiten we alle entiteiten uit die zijn getagd met Continent
of CountryRegion
tags.
Het NER-model opgeven
Deze functie maakt standaard gebruik van het meest recente beschikbare AI-model op uw tekst. U kunt uw API-aanvragen ook configureren voor het gebruik van een specifieke modelversie.
Service- en gegevenslimieten
Zie het artikel over servicelimieten voor informatie over de grootte en het aantal aanvragen dat u per minuut en seconde kunt verzenden.