Vad är anpassad namngiven entitetsigenkänning?

Custom NER är en av de anpassade funktionerna som erbjuds av Azure AI Language. Det är en molnbaserad API-tjänst som tillämpar maskininlärningsinformation så att du kan skapa anpassade modeller för anpassade namngivna entitetsigenkänningsuppgifter.

Med anpassad NER kan användare skapa anpassade AI-modeller för att extrahera domänspecifika entiteter från ostrukturerad text, till exempel kontrakt eller finansiella dokument. Genom att skapa ett anpassat NER-projekt kan utvecklare iterativt märka data, träna, utvärdera och förbättra modellprestanda innan de gör dem tillgängliga för förbrukning. Kvaliteten på märkta data påverkar modellens prestanda avsevärt. För att förenkla skapandet och anpassningen av din modell erbjuder tjänsten en anpassad webbportal som kan nås via Language Studio. Du kan enkelt komma igång med tjänsten genom att följa stegen i den här snabbstarten.

Den här dokumentationen innehåller följande artikeltyper:

  • Snabbstarter är komma igång-instruktioner som vägleder dig genom att göra begäranden till tjänsten.
  • Begrepp ger förklaringar av tjänstens funktioner och funktioner.
  • Instruktionsguider innehåller instruktioner för att använda tjänsten på mer specifika eller anpassade sätt.

Exempel på användningsscenarier

Anpassad namngiven entitetsigenkänning kan användas i flera scenarier i olika branscher:

Extrahering av information

Många finansiella och juridiska organisationer extraherar och normaliserar data från tusentals komplexa, ostrukturerade textkällor dagligen. Sådana källor omfattar bankutdrag, juridiska avtal eller bankformulär. Till exempel kan det ta flera dagar att extrahera dataextrahering av hypoteksapplikationer som görs manuellt av mänskliga granskare. Att automatisera de här stegen genom att skapa en anpassad NER-modell förenklar processen och sparar kostnad, tid och arbete.

Sökning är grundläggande för alla appar som visar textinnehåll för användare. Vanliga scenarier är katalog- eller dokumentsökning, produktsökning i detaljhandeln eller kunskapsutvinning för datavetenskap. Många företag i olika branscher vill skapa en omfattande sökupplevelse över privat, heterogent innehåll, som innehåller både strukturerade och ostrukturerade dokument. Som en del av pipelinen kan utvecklare använda anpassad NER för att extrahera entiteter från texten som är relevanta för deras bransch. Dessa entiteter kan användas för att utöka indexeringen av filen för en mer anpassad sökupplevelse.

Granskning och efterlevnad

I stället för att manuellt granska betydligt långa textfiler för granskning och tillämpning av principer kan IT-avdelningar i finansiella eller juridiska företag använda anpassad NER för att skapa automatiserade lösningar. Dessa lösningar kan vara användbara för att framtvinga efterlevnadsprinciper och konfigurera nödvändiga affärsregler baserat på kunskapsutvinningspipelines som bearbetar strukturerat och ostrukturerat innehåll.

Livscykel för projektutveckling

Användning av anpassad NER omfattar vanligtvis flera olika steg.

Utvecklingslivscykeln

  1. Definiera schemat: Känna till dina data och identifiera de entiteter som du vill extrahera. Undvik tvetydighet.

  2. Märk dina data: Etikettering av data är en viktig faktor för att fastställa modellens prestanda. Märk exakt, konsekvent och fullständigt.

    1. Etikett exakt: Märk alltid varje entitet till rätt typ. Inkludera bara det du vill extrahera, undvik onödiga data i etiketterna.
    2. Etikett konsekvent: Samma entitet bör ha samma etikett i alla filer.
    3. Etikett helt: Märk alla instanser av entiteten i alla dina filer.
  3. Träna modellen: Din modell börjar lära sig av dina märkta data.

  4. Visa modellens prestanda: När träningen har slutförts visar du modellens utvärderingsinformation, dess prestanda och vägledning om hur du kan förbättra den.

  5. Distribuera modellen: När du distribuerar en modell blir den tillgänglig för användning via analys-API:et.

  6. Extrahera entiteter: Använd dina anpassade modeller för entitetsextraheringsuppgifter.

Referensdokumentation och kodexempel

När du använder anpassad NER kan du läsa följande referensdokumentation och exempel för Azure AI Language:

Utvecklingsalternativ/språk Referensdokumentation Exempel
REST-API:er (redigering) REST API-dokumentation
REST-API:er (Runtime) REST API-dokumentation
C# (Runtime) C#-dokumentation C#-exempel
Java (Runtime) Java-dokumentation Java-exempel
JavaScript (Runtime) JavaScript-dokumentation JavaScript-exempel
Python (Runtime) Python-dokumentation Python-exempel

Ansvarsfull AI

Ett AI-system omfattar inte bara tekniken, utan även de personer som ska använda den, de personer som påverkas av den och den miljö där den distribueras. Läs transparensanteckningen för anpassad NER för att lära dig mer om ansvarsfull AI-användning och distribution i dina system. Du kan också se följande artiklar för mer information:

Nästa steg