Sdílet prostřednictvím


Co je vlastní klasifikace textu?

Vlastní klasifikace textu je jednou z vlastních funkcí nabízených jazykem Azure AI. Jedná se o cloudovou službu API, která používá inteligentní funkce strojového učení, která umožňuje vytvářet vlastní modely pro úlohy klasifikace textu.

Vlastní klasifikace textu umožňuje uživatelům vytvářet vlastní modely AI pro klasifikaci textu do vlastních tříd předem definovaných uživatelem. Vytvořením vlastního projektu klasifikace textu můžou vývojáři iterativně označovat data, trénovat, vyhodnocovat a zlepšovat výkon modelu před tím, než je zpřístupní ke spotřebě. Kvalita označených dat výrazně ovlivňuje výkon modelu. Kvůli zjednodušení sestavování a přizpůsobení modelu nabízí služba vlastní webový portál, ke kterému je možné přistupovat prostřednictvím jazykového studia. Můžete snadno začít se službou pomocí kroků v tomto rychlém startu.

Vlastní klasifikace textu podporuje dva typy projektů:

  • Klasifikace s jedním popiskem – každému dokumentu v datové sadě můžete přiřadit jednu třídu. Například filmový skript může být klasifikován pouze jako "Romantika" nebo "Komie".
  • Klasifikace více popisků – pro každý dokument v datové sadě můžete přiřadit více tříd. Například filmový skript může být klasifikován jako "Comedy" nebo "Romance" a "Comedy".

Tato dokumentace obsahuje následující typy článků:

  • Rychlé starty jsou úvodní pokyny, které vás provedou prováděním požadavků na službu.
  • Koncepty poskytují vysvětlení funkcí a funkcí služby.
  • Návody obsahují pokyny pro používání služby konkrétnějšími nebo přizpůsobenými způsoby.

Příklady scénářů použití

Vlastní klasifikaci textu je možné použít ve více scénářích v různých odvětvích:

Automatické e-maily nebo třídění lístků

Centra podpory všech typů dostávají velký objem e-mailů nebo lístků obsahujících nestrukturovaný, volný text a přílohy. Včasné přezkoumání, potvrzení a směrování odborníků na danou problematiku v interních týmech je velmi důležité. Třídění e-mailů v tomto měřítku vyžaduje, aby lidé kontrolovali a směrovali na správná oddělení, která zabíjejí čas a zdroje informací. Vlastní klasifikaci textu je možné použít k analýze příchozího textu a ke třídění a kategorizaci obsahu, který se má automaticky směrovat do příslušných oddělení pro další akce.

Vyhledávání je základní pro libovolnou aplikaci, která uživatelům zobrazí textový obsah. Mezi běžné scénáře patří vyhledávání katalogu nebo dokumentů, vyhledávání maloobchodních produktů nebo dolování znalostí pro datové vědy. Mnoho podniků v různých odvětvích se snaží vytvořit bohaté vyhledávání prostřednictvím soukromého heterogenního obsahu, který zahrnuje strukturované i nestrukturované dokumenty. Jako součást svého kanálu můžou vývojáři použít vlastní klasifikaci textu ke kategorizaci textu do tříd, které jsou relevantní pro své odvětví. Predikované třídy lze použít k obohacení indexování souboru pro více přizpůsobené vyhledávací prostředí.

Životní cyklus vývoje projektu

Vytvoření vlastního projektu klasifikace textu obvykle zahrnuje několik různých kroků.

Životní cyklus vývoje

Využijte tento postup a využijte model na maximum:

  1. Definujte schéma: Seznamte se s daty a určete třídy , mezi které chcete rozlišovat, aby nedocházelo k nejednoznačnosti.

  2. Označení dat: Kvalita popisování dat je klíčovým faktorem při určování výkonu modelu. Dokumenty, které patří do stejné třídy, by měly mít vždy stejnou třídu, pokud máte dokument, který může spadat do dvou tříd, používají projekty klasifikace více popisků. Vyhněte se nejednoznačnosti tříd, ujistěte se, že vaše třídy jsou jasně oddělitelné od sebe, zejména u projektů klasifikace s jedním popiskem.

  3. Trénování modelu: Váš model se začíná učit z označených dat.

  4. Zobrazení výkonu modelu: Zobrazte podrobnosti vyhodnocení modelu a určete, jak dobře funguje při zavedení nových dat.

  5. Nasazení modelu: Nasazení modelu zpřístupňuje použití prostřednictvím rozhraní API pro analýzu.

  6. Klasifikovat text: Použijte vlastní model pro vlastní úkoly klasifikace textu.

Referenční dokumentace a ukázky kódu

Při používání vlastní klasifikace textu si projděte následující referenční dokumentaci a ukázky jazyka Azure AI:

Možnost vývoje / jazyk Referenční dokumentace Ukázky
Rozhraní REST API (vytváření) Dokumentace k rozhraní REST API
Rozhraní REST API (modul runtime) Dokumentace k rozhraní REST API
C# (runtime) Dokumentace k jazyku C# Ukázky v C# – Ukázky klasifikace s jedním popiskem V# – Klasifikace více popisků
Java (runtime) Dokumentace k Javě Ukázky v Javě – Ukázky Java pro klasifikaci s jedním popiskem – Klasifikace více popisků
JavaScript (modul runtime) Dokumentace k JavaScriptu Ukázky JavaScriptu – Ukázky javascriptové klasifikace s jedním popiskem – Klasifikace více popisků
Python (runtime) Dokumentace k Pythonu Ukázky Pythonu – Ukázky pro klasifikaci s jedním popiskem – Ukázky Pythonu s více popisky

Zodpovědná AI

Systém AI zahrnuje nejen technologii, ale také lidi, kteří ji budou používat, osoby, které ho budou ovlivněny, a prostředí, ve kterém je nasazené. Přečtěte si poznámku transparentnosti pro vlastní klasifikaci textu a seznamte se s zodpovědným používáním a nasazením umělé inteligence ve vašich systémech. Další informace najdete také v následujících článcích:

Další kroky

  • Pomocí článku rychlý start můžete začít používat vlastní klasifikaci textu.

  • Při procházení životního cyklu vývoje projektu si projděte glosář , kde najdete další informace o termínech používaných v dokumentaci k této funkci.

  • Nezapomeňte zobrazit limity služeb pro informace, jako je regionální dostupnost.