Výroky

Důležité

Služba LUIS bude vyřazena 1. října 2025 a od 1. dubna 2023 nebudete moct vytvářet nové prostředky LUIS. Doporučujeme migrovat aplikace LUIS do porozumění konverzačnímu jazyku, abyste mohli využívat další podporu produktů a vícejazyčné funkce.

Promluvy jsou vstupy od uživatelů, které vaše aplikace potřebuje interpretovat. Pokud chcete službu LUIS vytrénovat tak, aby z těchto vstupů extrahovali záměry a entity, je důležité pro každý záměr zachytit různé ukázkové promluvy. Aktivní učení nebo proces dalšího trénování na nové promluvy je nezbytné pro inteligenci strojového učení, kterou služba LUIS poskytuje.

Shromážděte promluvy, které si myslíte, že uživatelé budou zadávat. Zahrnout promluvy, které znamenají stejnou věc, ale jsou sestaveny různými způsoby:

  • Délka promluvy – krátká, střední a dlouhá pro vaši klientskou aplikaci
  • Délka slova a fráze
  • Umístění ve Wordu – entita na začátku, uprostřed a na konci promluvy
  • Gramatika
  • Pluralizace
  • Vyplývající
  • Volba podstatných jmen a sloves
  • Interpunkce – použití správné i nesprávné gramatiky

Volba různých promluv

Když do modelu LUIS začnete přidávat ukázkové promluvy , je potřeba mít na paměti několik principů:

Promluvy nejsou vždy dobře vytvořené.

Vaše aplikace může potřebovat zpracovat věty, například "Rezervovat lístek do Paříže pro mě", nebo fragment věty, například "Rezervace" nebo "Let v Paříži" Uživatelé také často dělají pravopisné chyby. Při plánování aplikace zvažte, jestli chcete před předáním do služby LUIS použít kontrolu pravopisu Bingu ke správnému zadání uživatele.

Pokud nekontrolujete uživatelské promluvy kontroly pravopisu, měli byste službu LUIS trénovat na promluvách, které obsahují překlepy a pravopisné pravopisy.

Použití reprezentativního jazyka uživatele

Při výběru promluv mějte na paměti, že to, co si myslíte, že běžné termíny nebo fráze nemusí být běžné pro typického uživatele klientské aplikace. Nemusí mít zkušenosti s doménou nebo používat jinou terminologii. Buďte opatrní při používání termínů nebo frází, které by uživatel řekl pouze v případě, že by byl odborníkem.

Volba pestré terminologie a formulace

Zjistíte, že i když se snažíte vytvářet různé vzory vět, budete stále opakovat slovní zásobu. Například následující promluvy mají podobný význam, ale odlišnou terminologii a formulaci:

  • "Návody získat počítač?"
  • "Kde získám počítač?"
  • "Chci získat počítač, jak na to?
  • "Kdy můžu mít počítač?"

Základní pojem zde, počítač, není různý. Použijte alternativy, jako je stolní počítač, přenosný počítač, pracovní stanice nebo dokonce jen počítač. Služba LUIS může inteligentně odvodit synonyma z kontextu, ale když vytváříte promluvy pro trénování, je vždy lepší je měnit.

Příklady promluv v každém záměru

Každý záměr musí mít ukázkové promluvy – alespoň 15. Pokud máte záměr, který nemá žádné ukázkové promluvy, nebudete moct službu LUIS trénovat. Pokud máte záměr s jedním nebo několika ukázkovými promluvami, služba LUIS nemusí přesně předpovědět záměr.

Přidání malých skupin promluv

Pokaždé, když budete iterovat model, abyste ho zlepšili, nepřidávejte velké množství promluv. Zvažte přidání promluv v množství 15. Potom trénujte, publikujte a znovu otestujte .

Služba LUIS vytváří efektivní modely s promluvami, které jsou pečlivě vybrány autorem modelu LUIS. Přidání příliš mnoha promluv není cenné, protože představuje nejasnost.

Je lepší začít s několika promluvami a pak zkontrolovat promluvy koncového bodu a zjistit správné predikce záměru a extrakci entit.

Normalizace promluvy

Normalizace promluv je proces ignorování efektů typů textu, jako je interpunkce a diakritika během trénování a předpovědi.

Nastavení normalizace promluvy je ve výchozím nastavení vypnuté. Mezi tato nastavení patří:

  • Wordové formuláře
  • Diakritiky
  • Interpunkční znaménka

Pokud zapnete nastavení normalizace, změní se skóre v podokně Test , dávkové testy a dotazy na koncové body pro všechny promluvy pro toto nastavení normalizace.

Při klonování verze na portálu LUIS se nastavení verze uchovává v nové klonované verzi.

Nastavte nastavení verze aplikace pomocí portálu LUIS tak, že v horní navigační nabídce vyberete Spravovat na stránce Nastavení aplikace. Můžete také použít rozhraní API pro aktualizaci verze Nastavení. Další informace najdete v referenční dokumentaci.

Wordové formuláře

Normalizaceformulářůch

Diakritiky

Diakritická znaménka jsou značky nebo znaménka v textu, například:

İ ı Ş Ğ ş ğ ö ü

Interpunkční znaménka

Normalizace interpunkce znamená, že před natrénováním modelů a před předpovězením dotazů koncového bodu se z promluv odebere interpunkce.

Interpunkce je samostatný token ve službě LUIS. Promluva, která obsahuje tečku na konci, je samostatná promluva, která neobsahuje tečku na konci, a může získat dvě různé předpovědi.

Pokud interpunkční znaménka není normalizována, služba LUIS ve výchozím nastavení neignoruje interpunkční znaménka, protože některé klientské aplikace můžou na tyto značky umístit význam. Nezapomeňte zahrnout ukázkové promluvy, které používají interpunkci, a ty, které ne, aby oba styly vrátily stejné relativní skóre.

Ujistěte se, že model zpracovává interpunkci buď v ukázkových promluvách (ať už s interpunkcí i bez interpunkce), nebo ve vzorech , kde je snazší interpunkci ignorovat. Například: Žádám o pozici {Job} [.]

Pokud interpunkce nemá v klientské aplikaci žádný konkrétní význam, zvažte ignorování interpunkce normalizací interpunkce.

Ignorování slov a interpunkce

Pokud chcete ignorovat konkrétní slova nebo interpunkci ve vzorech, použijte vzor s ignorovanou syntaxí hranatých závorek, [].

Trénování se všemi promluvami

Trénování je obecně ne deterministické: Předpověď promluvy se může mírně lišit v různých verzích nebo aplikacích. Ne deterministické trénování můžete odebrat aktualizací rozhraní API pro nastavení verzí pomocí dvojice název/hodnota UseAllTrainingData tak, aby používala všechna trénovací data.

Testování promluv

Vývojáři by měli začít testovat svou aplikaci LUIS se skutečnými daty odesláním promluv na adresu URL koncového bodu předpovědi. Tyto promluvy slouží ke zlepšení výkonu záměrů a entit pomocí revizních promluv. Testy odeslané pomocí testovacího podokna na portálu LUIS se neodesílají prostřednictvím koncového bodu a nepřispívají k aktivnímu učení.

Kontrola promluv

Po vytrénování, publikování a přijímání dotazů na koncový bod modelu zkontrolujte promluvy navrhované službou LUIS. Luis vybere promluvy koncového bodu, které mají nízké skóre pro záměr nebo entitu.

Osvědčené postupy

Popisek pro význam slova

Pokud je volba slova nebo uspořádání slov stejné, ale neznamená to totéž, neoznačíte ho entitou.

V následujících promluvách je slovo fér homograf, což znamená, že je napsané stejně, ale má jiný význam:

  • "Jaký druh župaských veletrhů se děje v oblasti Seattlu v létě?"
  • "Je aktuální 2hvězdičkové hodnocení pro veletrh restaurace?

Pokud chcete, aby entita události našla všechna data události, označte slovo spravedlivé v první promluvě, ale ne ve druhé.

Nepřemýšlejte možné varianty promluv

Služba LUIS očekává varianty promluv záměru. Promluvy se mohou lišit, zatímco mají stejný celkový význam. Varianty můžou zahrnovat délku promluvy, volbu slova a umístění slov.

Nepoužívejte stejný formát. Používejte různé formáty
Koupit lístek do Seattlu Koupit 1 lístek do Seattlu
Koupit lístek do Paříže Vyhraďte si dvě místa na červeném oku do Paříže příští pondělí
Koupit lístek do Orlando Chci si rezervovat 3 vstupenky do Orlando na jarní přestávku

Druhý sloupec používá různé příkazy (nákup, rezerva, kniha), různá množství (1, &"dva", 3) a různá uspořádání slov, ale všechny mají stejný záměr koupit letenky na cestování.

Nepřidávejte do záměrů příliš mnoho ukázkových promluv.

Po publikování aplikace přidejte promluvy jenom z aktivního učení v procesu životního cyklu vývoje. Pokud jsou promluvy příliš podobné, přidejte vzor.

Další kroky