Zdieľať cez


Skôr než vytvoríte model klasifikácie kategórie

Skôr než začnete vytvárať model klasifikácie kategórie, uistite sa, že sa vaše údaje nachádzajú v službe Microsoft Dataverse a že sú štruktúrované v správnom formáte.

Predpoklady

  • Tento model vyžaduje, aby boli školiace údaje k dispozícii v rámci tabuľky Dataverse. Podpora údajov z externých zdrojov momentálne nie je k dispozícii.

  • Uistite sa, že vám správca priradil bezpečnostnú rolu s oprávnením na čítanie pre tabuľku, ktorá obsahuje trénovacie údaje.

  • Uistite sa, že máte príslušné povolenia na vytváranie tabuliek vo vašom prostredí. Power Platform Môžete použiť buď Prispôsobovač systému, alebo vstavané bezpečnostné roly správcu systému .

Podporované jazyky

AI Builder Klasifikácia kategórií podporuje nasledujúce jazyky. Ak sa pokúsite klasifikovať text v iných jazykoch, váš model nemusí fungovať správne.

  • angličtina
  • Francúzština
  • Nemčina
  • Taliančina
  • Španielčina
  • Portugalčina

Príprava údajov

Údaje o školení použité na školenie modelu z tabuľky Dataverse by mali zodpovedať nasledujúcemu:

  • Uložte text a značky ako dva stĺpce v tej istej tabuľke. Každý riadok musí obsahovať údaje v stĺpci Text .

  • K údajom v tom istom riadku v stĺpci Text môžete priradiť jeden alebo viacero tagov. Stĺpec Značky môžete tiež nechať prázdny.

  • Ak ste v textovej vzorke identifikovali viacero značiek, uveďte ich ako text s oddelenými časťami v poliach Značky . Oddeľovače sú v súčasnosti podporované čiarkami (,), bodkočiarkami (;) a znakmi tabulátora.

    Text Značky
    Skvelá čistá a tichá izba s bezplatnými raňajkami Jedáleň
    Malá, ale dobre zorganizovaná miestnosť, ktorá bola pohodlná Miestnosť
    Milujem výhľad z 13. poschodia (žiadne)
  • Uistite sa, že pre každú značku, ktorú chcete extrahovať, máte k dispozícii minimálne 10 rôznych textových ukážok. Štítky s menej ako 10 vzorkami nebudú vyškolené. V predchádzajúcom príklade malo byť minimálne 10 riadkov označených tagmi Jedáleň a Izba .

  • Ak bola položka Miestnosť označená v menej ako 10 riadkoch údajov, bude ignorovaná. Model nebude vyškolený na kategorizáciu údajov pre túto značku.

  • Pre každý použitý tag uveďte minimálne 10 textových vzoriek, kde sa tag nepoužíva.

    Text Značky
    Skvelá čistá a tichá izba s bezplatnými raňajkami Miestnosť
    Malá, ale dobre zorganizovaná miestnosť, ktorá bola pohodlná Miestnosť
    (žiadne) Miestnosť

    Ak sú všetky riadky v tabuľke označené tagom Miestnosť a neexistujú žiadne riadky – alebo menej ako 10 riadkov – ktoré boli označené tagom iného štítku, model neprejde procesom trénovania.

  • Tabuľka musí mať najmenej dve značky a každá z nich musí mať 10 ukážok textu.

  • Môžete definovať až 200 rôznych značiek. Každá značka je kategória, ktorá bude identifikovaná a extrahovaná z daného textu.

  • Každá vzorka textových údajov musí mať menej ako 5 000 znakov.

Ak nemáte tréningové údaje a chcete vyskúšať klasifikáciu podľa kategórií, postupujte podľa týchto pokynov na použitie vzorových údajov. AI Builder

Príklady formátu školiacich údajov

Táto časť poskytuje príklady formátu školiacich údajov v tabuľke Dataverse.

Stĺpce Typ údajov Veľkosť
Vytvoril Text 3,000
Značky Text 100



Vytvoril Značky
Počas pobytu som bol úplne ignorovaný. Zamestnanci ma nedokázali vyzdvihnúť
aspiruje a má UTI. Tiež som mal zápal pľúc.
Starostlivosť
Bol som videný veľmi skoro po príchode zakaždým a všetok personál, zdravotná sestra, lekár,
a anesteziológ boli veľmi nápomocní. Zdá sa, že je tu dobrý pocit tímovej práce.
Personál, vstupná kontrola
Vybavenie sa zdalo byť aktuálne. Zdá sa, že zdravotná sestra/zdravotnícky asistent
boli celkom starostlivý.
Vybavenie, personál

Poznámka

Ak nemáte vlastné tréningové údaje a chcete vyskúšať klasifikáciu podľa kategórií, môžete začať stiahnutím vzorových údajov pre model klasifikácie podľa kategórií. AI Builder Viac informácií: Použitie vzorových údajov na klasifikáciu do kategórií

Importujte svoje údaje do Dataverse

Pretože školiace údaje pre model klasifikácie kategórií musia byť dostupné ako tabuľka Dataverse, začneme s prípravou údajov v tabuľke Dataverse.

Dataverse obsahuje výkonnú množinu konektorov, ktoré vám pomôžu importovať údaje z mnohých zdrojov. Viac informácií: Pridanie údajov do tabuľky v Microsoft Dataverse pomocou Power Query.

Ako príklad môžete takto importovať tréningové údaje z hárka Excel. V tomto príklade sa používa súbor, ktorý obsahuje údaje uvedené v nasledujúcej tabuľke.

Identifikátor Značky Text
1 Stolovanie S raňajkami boli trochu problémy.
2 Jedáleň Skvelá čistá a tichá izba s bezplatnými raňajkami.
3 Izba, stolovanie, poloha Personál, s ktorým sme sa stretli, bol veľmi priateľský a ochotný. Chodby a naša izba boli čisté a pohodlné. Raňajky (v cene) boli muffiny a rožky.
4 Poloha, stolovanie Okolie je plné barov a reštaurácií. 
5 Service Personál bol úctivý.

V tomto prípade sú značky oddelené čiarkou (,). Ako alternatívu môžete použiť bodkočiarku (;) alebo tabulátor.

  1. Prihlásiť sa do Power Apps.

  2. Zvoľte si prostredie, v ktorom chcete pracovať.

    Snímka obrazovky s výberom prostredia.

  3. Vyberte Údaje>Tabuľky.

  4. Výber tabuľky. Ak ešte nemáte tabuľku, postupujte podľa krokov v časti Vytvorenie vlastnej tabuľky. ...

  5. Vyberte Dáta>Získať dáta>Získať dáta z Excelu z pása s nástrojmi vybratej tabuľky.

    Snímka obrazovky zobrazujúca získanie údajov z Excelu.

  6. Na obrazovke Importovať údaje vyberte súbor programu Excel, ktorý obsahuje údaje uvedené v časti Príklady formátu tréningových údajov uvedenej vyššie v tejto téme, a potom vyberte možnosť Nahrať.

    Snímka obrazovky nahrávania súboru programu Excel.

  7. Ak chcete skontrolovať mapovania polí na obrazovke Mapovania stĺpcov pre kategóriu textu , vyberte možnosť Mapovať stĺpce.

    Snímka obrazovky zobrazujúca mapovanie stĺpcov pre kategóriu textu.

    Na ľavej strane sú uvedené všetky stĺpce definované v tabuľke. Rozbaľovací zoznam vpravo zobrazuje stĺpce dostupné v súbore Excel.

    Priraďte stĺpce Tags, Text a Id z Excelu k príslušným stĺpcom v tabuľke.

  8. Po namapovaní stĺpcov sa vráťte ku kroku importu výberom možnosti Uložiť zmeny v pravom hornom rohu.

    Snímka obrazovky s uložením zmien.

  9. Keď sa zobrazí správa Stav mapovania ako úspešný, spustite proces importu výberom možnosti Importovať v pravom hornom rohu.

    Snímka obrazovky so začiatkom procesu importu výberom tlačidla Importovať.

  10. Proces importu môže v závislosti od množstva importovaných údajov trvať niekoľko minút. Po niekoľkých minútach obnovte kartu Údaje v tabuľke, aby ste našli všetky záznamy importované zo súboru programu Excel.

Teraz ste pripravení prejsť na ďalší krok.

Ďalší krok

Vytvorenie modelu klasifikácie kategórií