Termíny a definice používané při porozumění jazyku konverzace

Článek
12/19/2023

V tomto článku se dozvíte o některých definicích a termínech, se kterými se můžete setkat při používání porozumění jazyku konverzace.

Entita

Entity jsou slova v promluvách, která popisují informace používané k plnění nebo identifikaci záměru. Pokud je vaše entita složitá a chcete, aby model identifikoval konkrétní části, můžete model rozdělit na subentity. Můžete například chtít, aby model předpověděl adresu, ale také subentity ulic, města, státu a PSČ.

Skóre F1

Skóre F1 je funkce přesnosti a úplnosti. Je potřeba, když hledáte rovnováhu mezi přesností a úplností.

Záměr

Záměr představuje úlohu nebo akci, kterou chce uživatel provést. Jedná se o účel nebo cíl vyjádřený ve vstupu uživatele, jako je rezervace letu nebo platba faktury.

Entita seznamu

Entita seznamu představuje pevnou uzavřenou sadu souvisejících slov spolu s jejich synonymy. Entity seznamu jsou přesné shody, na rozdíl od strojově naučených entit.

Entita bude predikována, pokud je v seznamu zahrnuto slovo v entitě seznamu. Pokud máte například entitu seznamu s názvem "size" a v seznamu máte slova "malá, střední, velká", pak se entita velikosti předpoví pro všechny promluvy, ve kterých se slova "malá", "střední" nebo "velká" použijí bez ohledu na kontext.

Modelování

Model je objekt, který je vytrénovaný tak, aby dělal určitou úlohu, v tomto případě rozumí úkolům konverzace. Modely se trénují tak, že poskytují data s popisky, ze které se můžete učit, aby je bylo možné později použít k pochopení promluv.

Vyhodnocení modelu je proces, který se provádí hned po trénování, abyste věděli, jak dobře model funguje.
Nasazení je proces přiřazení modelu k nasazení, aby byl dostupný pro použití prostřednictvím rozhraní API pro predikce.

Přeurčení

K přeurčení dochází, když je model fixovaný na konkrétní příklady a nedokáže dobře zobecnit.

Přesnost

Měří, jak přesný/přesný je váš model. Jedná se o poměr mezi správně identifikovanými pozitivy (pravdivě pozitivními výsledky) a všemi identifikovanými pozitivními výsledky. Metrika přesnosti ukazuje, kolik predikovaných tříd je správně označeno.

Project

Projekt je pracovní oblast pro vytváření vlastních modelů ML na základě vašich dat. K vašemu projektu máte přístup jenom vy a ostatní uživatelé, kteří mají přístup k používanému prostředku Azure.

Recall

Měří schopnost modelu predikovat skutečné pozitivní třídy. Jedná se o poměr mezi predikovanými pravdivě pozitivními výsledky a tím, co bylo skutečně označeno. Metrika úplnosti ukazuje, kolik predikovaných tříd je správných.

Regulární výraz

Entita regulárního výrazu představuje regulární výraz. Entity regulárních výrazů jsou přesné shody.

Schéma

Schéma je definováno jako kombinace záměrů a entit v rámci projektu. Návrh schématu je klíčovou součástí úspěchu vašeho projektu. Při vytváření schématu se chcete zamyslet nad tím, které záměry a entity by měly být zahrnuty do projektu.

Data pro trénink

Trénovací data jsou sada informací, které jsou potřeba k trénování modelu.

Výrok

Promluva je vstup uživatele, který představuje krátký text představující větu v konverzaci. Je to fráze v přirozeném jazyce, například "rezervovat 2 vstupenky do Seattlu příští úterý". Přidají se ukázkové promluvy pro trénování modelu a model předpovídá nové promluvy za běhu.