Sdílet prostřednictvím


Než vytvoříte model klasifikace kategorie

Než vytvoříte model klasifikace kategorie, bude vhodné zajistit, aby data byla v Microsoft Dataverse a byla strukturována ve správném formátu.

Požadavky

  • Tento model vyžaduje, aby trénovací data byla dostupná v tabulce Dataverse. Podpora dat z externích zdrojů v současné době není k dispozici.

  • Ověřte, že vám správce přiřadil roli zabezpečení s oprávněním ke čtení tabulky obsahující trénovací data.

  • Ověřte, že máte příslušná oprávnění k vytváření tabulek v prostředí Power Platform. Můžete použít integrovanou roli zabezpečení Úpravce systému nebo Správce systému.

Podporované jazyky

Klasifikace kategorií AI Builder podporuje následující jazyky. Pokud se pokusíte klasifikovat text v jiných jazycích, nemusí model správně fungovat.

  • Angličtina
  • Francouzština
  • Němčina
  • Italština
  • Španělština
  • Portugalština

Příprava dat

Tréninková data použitá k trénování modelu z tabulky Dataverse by měla vyhovovat následujícím požadavkům:

  • Text a značky jsou uloženy ve stejné tabulce jako dva sloupce. Každý řádek musí obsahovat data ve sloupci Text.

  • Do dat ve stejném řádku ve sloupci Text můžete zadat jednu nebo více značek. Sloupec Značky můžete také ponechat prázdný.

  • Pokud jste v textové ukázce identifikovali více značek, zadejte je jako oddělený text do polí Značky. V současné době jsou jako oddělovače podporovány čárky (,), středníky (;) a tabulátory.

    Text Štítky
    Prostorná čistá a tichá místnost se snídaní dle vlastního výběru Stolování, místnost
    Malá, ale dobře koncipovaná pohodlná místnost Místnost
    Miluji výhled ze 13. patra (žádné)
  • Pro každou značku, kterou chcete extrahovat, zajistěte minimálně 10 odlišných textových ukázek. Značky s méně než 10 ukázkami nebudou trénovány. V předchozím příkladu mělo být minimálně 10 řádků se značkami Stolování a Místnost.

  • Pokud byla značka Místnost u méně než 10 řádků, bude ignorována. Model nebude vycvičen pro kategorizaci dat pro tuto značku.

  • Pro každou použitou značku poskytněte minimálně 10 textových ukázek, kde nejsou žádné použity.

    Text Štítky
    Prostorná čistá a tichá místnost se snídaní dle vlastního výběru Místnost
    Malá, ale dobře koncipovaná pohodlná místnost Místnost
    (žádné) Místnost

    Pokud jsou označeny všechny řádky v tabulce jako Místnost a neexistují žádné řádky – nebo méně než 10 řádků –, které byly označeny jinou značkou, model neprojde procesem trénování.

  • Tabulka musí obsahovat alespoň dvě značky a každá z nich musí mít 10 textových ukázek.

  • Můžete definovat až 200 různých značek. Každá značka je kategorie, která bude identifikována a extrahována z daného textu.

  • Každý vzorek textových dat musí mít méně než 5 000 znaků.

Pokud nemáte trénovací data a chcete vyzkoušet klasifikaci kategorií AI Builder, můžete pomocí těchto pokynů použít ukázková data.

Příklady formátu trénovacích dat

Tato sekce poskytuje příklady formátu trénovacích dat v tabulce Dataverse.

Sloupce Datový typ Velikost
Komentáře Text 3,000
Štítky Text 100



Komentáře Štítky
Během svého pobytu jsem byl úplně ignorován. Personál u mě nerozpoznal
nastupující a aktivní IMC. Také jsem měl zápal plic.
Péče
Při každé návštěvě jsem byl rychle prohlédnut a veškerý personál, zdravotní sestra, lékař
a anesteziolog byli velmi nápomocní. Zdá se, že tu dobře funguje týmová práce.
Personál, prohlídka
Vybavení vypadalo moderně. Sestra / zdravotnický asistent se
docela starali.
Zařízení, personál

Poznámka:

Pokud nemáte vlastní tréninková data a chcete vyzkoušet klasifikaci kategorií AI Builder, začněte stažením vzorových dat pro model klasifikace kategorií. Další informace: Použití ukázkových dat pro klasifikaci kategorie

Import dat do Dataverse

Protože trénovací data pro model klasifikace kategorie musí být k dispozici jako tabulka Dataverse, začněme s přípravou dat v tabulce Dataverse.

Dataverse obsahuje výkonnou sadu konektorů, které vám pomůžou importovat z mnoha zdrojů. Více informací: Přidání dat do tabulky v Microsoft Dataverse pomocí Power Query.

Jako příklad zde uvádíme, jak importovat trénovací data z excelového sešitu. Tento příklad používá soubor obsahující to, co je uvedeno v následující tabulce.

Id Štítky Text
0 Stolování Snídaně nebyla úplně bez problémů.
2 Stolování, místnost Prostorná čistá a tichá místnost se snídaní dle vlastního výběru.
3 Pokoj, stolování, poloha Personál, se kterým jsme se setkali, byl velmi přátelský a ochotný. Chodby a náš pokoj byly čisté a pohodlné. Snídaně (v ceně) byly muffiny a bagely.
4 Poloha, stolování Okolí je plné barů a restaurací. 
5 Service Personál byl uctivý.

V tomto příkladu jsou značky odděleny čárkou (,). Alternativně můžete použít středník (;) nebo znak tabulátoru.

  1. Přihlaste se ke službě Power Apps.

  2. Vyberte prostředí, ve kterém chcete pracovat.

    Screenshot výběru prostředí.

  3. Vyberte Data>Tabulky.

  4. Vyberte svou tabulku. Pokud tabulku ještě nemáte, postupujte podle pokynů v části Vytvoření vlastní tabulky.

  5. Vyberte Data>Získat data>Získat data z Excelu z pásu vybrané tabulky.

    Screenshot ukazující možnost Získat data z Excelu.

  6. Na obrazovce Import dat vyberte soubor aplikace Excel, který obsahuje data uvedená v sekci Příklady formátu trénovacích dat dříve v tomto tématu, a poté vyberte Nahrát.

    Screenshot nahrávání souboru aplikace Excel.

  7. Chcete-li zkontrolovat mapování polí na obrazovce Mapování sloupců pro kategorii Text, vyberte Mapovat sloupce.

    Screenshot zobrazující mapování sloupců pro kategorii textu.

    Na levé straně jsou uvedeny všechny sloupce definované v tabulce. Rozevírací seznam vpravo zobrazuje sloupce dostupné v souboru aplikace Excel.

    Mapujte sloupce Značky, Text a ID z Excelu do příslušných sloupců v tabulce.

  8. Poté namapování sloupců přejděte zpět na krok importu výběrem možnosti Uložit změny v pravém horním rohu.

    Screenshot ukládání změn.

  9. Poté, co uvidíte Stav mapování jako úspěšný, spusťte proces importu volbou Importovat v pravém horním rohu.

    Screenshot zahájení procesu importu výběrem tlačítka Importovat.

  10. Proces importu může trvat několik minut v závislosti na objemu importovaných dat. Po několika minutách aktualizujte kartu Data v tabulce, čímž vyhledáte všechny záznamy importované ze souboru aplikace Excel.

Nyní jste připraveni přejít k dalšímu kroku.

Další krok

Vytvoření modelu klasifikace kategorie