Sdílet prostřednictvím


Co je rozpoznávání vlastních pojmenovaných entit?

Rozpoznávání vlastních pojmenovaných entit (NER) je cloudová API služba, která využívá strojové učení ke tvorbě modelů navržených pro vaše jedinečné požadavky na rozpoznávání entit. Jedná se o jednu ze specializovaných funkcí dostupných prostřednictvím jazyka Azure v nástrojích Foundry. Pomocí vlastního NER můžete vytvořit modely AI, které extrahují entity specifické pro doménu z nestrukturovaného textu, jako jsou kontrakty nebo finanční dokumenty. Při spuštění vlastního projektu NER můžete opakovaně označovat data, trénovat a vyhodnocovat model a zlepšit jeho výkon před nasazením. Kvalita označených dat je nezbytná, protože přímo ovlivňuje přesnost modelu.

Kvůli zjednodušení sestavování a přizpůsobení modelu nabízí služba vlastní webovou platformu, ke které lze přistupovat prostřednictvím Microsoft Foundry. Můžete snadno začít se službou pomocí kroků v tomto rychlém startu.

Tato dokumentace obsahuje následující typy článků:

  • Rychlé starty jsou úvodní pokyny, které vás provedou prováděním požadavků na službu.
  • Koncepty poskytují vysvětlení funkcionality a vlastností služby.
  • Návody obsahují pokyny pro používání služby konkrétnějšími nebo přizpůsobenými způsoby.

Příklady scénářů použití

Rozpoznávání vlastních pojmenovaných entit je možné použít ve více scénářích v různých odvětvích:

Extrakce informací

Mnoho finančních a právních organizací denně extrahuje a normalizuje data z tisíců složitých nestrukturovaných textových zdrojů. Mezi tyto zdroje patří bankovní výpisy, právní smlouvy nebo bankovní formuláře. Například ruční extrakce údajů z žádosti o hypotéku může trvat několik dní. Automatizace těchto kroků vytvořením vlastního modelu NER zjednodušuje proces a šetří náklady, čas a úsilí.

Vyhledávání je základní pro libovolnou aplikaci, která uživatelům zobrazí textový obsah. Mezi běžné scénáře patří vyhledávání katalogů nebo dokumentů, vyhledávání maloobchodních produktů nebo dolování znalostí pro datové vědy. Mnoho podniků v různých odvětvích chce vytvořit bohaté vyhledávací prostředí nad soukromým, heterogenním obsahem, který zahrnuje strukturované i nestrukturované dokumenty. Jako součást svého zpracovatelského řetězce mohou vývojáři použít vlastní NER k vyextrahování entit z textu, které jsou relevantní pro jejich odvětví. Tyto entity mohou být použity k obohacení indexování souboru pro přizpůsobení vyhledávacího zážitku.

Audit a dodržování předpisů

Místo ruční kontroly dlouhých textových souborů za účelem auditování a použití zásad můžou IT oddělení ve finančních nebo právních podnicích používat vlastní NER k vytváření automatizovaných řešení. Tato řešení můžou být užitečná k vynucení zásad dodržování předpisů a nastavení nezbytných obchodních pravidel na základě kanálů dolování znalostí, které zpracovávají strukturovaný a nestrukturovaný obsah.

Životní cyklus vývoje projektu

Použití vlastního NER obvykle zahrnuje několik různých kroků.

Životní cyklus vývoje

  1. Definujte schéma: Poznejte svá data a identifikujte entity, které chcete extrahovat. Vyhněte se nejednoznačnosti.

  2. Označení dat: Popisování dat je klíčovým faktorem při určování výkonu modelu. Označit přesně, konzistentně a zcela.

    • Popisek přesně: Vždy označte každou entitu správným typem. Uveďte jenom to, co chcete extrahovat a vyhnout se zbytečným datům v popiscích.
    • Popisek konzistentně: Stejná entita by měla mít stejný popisek ve všech souborech. Popsat úplně: Označte všechny instance entity ve všech svých souborech.
  3. Trénování modelu: Váš model se začíná učit z označených dat.

  4. Prohlédněte si výkon modelu: Po trénování zkontrolujte výsledky vyhodnocení a analyzujte výkon, aby se zlepšil.

  5. Nasazení modelu: Nasazení modelu zpřístupňuje použití prostřednictvím rozhraní API pro analýzu.

  6. Extrakce entit: Použití vlastních modelů pro úlohy extrakce entit

Referenční dokumentace a ukázky kódu

Když používáte vlastní NER, projděte si následující referenční dokumentaci a ukázky jazyka Azure v nástrojích Foundry:

Možnost vývoje / jazyk Referenční dokumentace Ukázky
Rozhraní REST API (vytváření) Dokumentace k rozhraní REST API
Rozhraní REST API (modul runtime) Dokumentace k rozhraní REST API
C# (běhové prostředí) Dokumentace k jazyku C# Ukázky jazyka C#
Java (runtime) Dokumentace k Javě Ukázky v Javě
JavaScript (běhové prostředí) Dokumentace k JavaScriptu Ukázky JavaScriptu
Python (Běhové prostředí) Dokumentace k Pythonu Ukázky Pythonu

Zodpovědná AI

Systém AI zahrnuje nejen technologii, ale také uživatele, kteří ho používají, osoby, které ho mají vliv, a prostředí nasazení. Přečtěte si poznámku transparentnosti , kde se dozvíte o zodpovědném používání a nasazení umělé inteligence ve vašich systémech. Další informace najdete v následujících článcích:

Další kroky

  • Pomocí článku rychlého startu můžete začít používat rozpoznávání vlastních pojmenovaných entit.

  • Při procházení životního cyklu vývoje projektu si projděte glosář , kde najdete další informace o termínech používaných v dokumentaci k této funkci.

  • Nezapomeňte zobrazit limity služeb pro informace, jako je regionální dostupnost.