Zdieľať cez


Skôr než vytvoríte model klasifikácie kategórie

Skôr než začnete vytvárať model klasifikácie kategórie, uistite sa, že sa vaše údaje nachádzajú v službe Microsoft Dataverse a že sú štruktúrované v správnom formáte.

Predpoklady

  • Tento model vyžaduje, aby boli školiace údaje k dispozícii v rámci tabuľky Dataverse. Podpora údajov z externých zdrojov momentálne nie je k dispozícii.

  • Uistite sa, že vám váš administrátor pridelil rola zabezpečenia s oprávnením na čítanie pre tabuľku, ktorá obsahuje tréningové dáta.

  • Uistite sa, že máte príslušné povolenia na vytváranie tabuliek vo svojom Power Platform prostredí. Môžete použiť vstavané roly zabezpečenia System Customizer alebo System Administrator.

Podporované jazyky

AI Builder klasifikácia kategórií podporuje nasledujúce jazyky. Ak sa pokúsite klasifikovať text v iných jazykoch, váš model nemusí fungovať správne.

  • angličtina
  • Francúzština
  • Nemčina
  • Taliančina
  • Španielčina
  • Portugalčina

Príprava údajov

Údaje o školení použité na školenie modelu z tabuľky Dataverse by mali zodpovedať nasledujúcemu:

  • Uložte text a značky ako dva stĺpce v tej istej tabuľke. Každý riadok musí obsahovať údaje v stĺpci Text .

  • K údajom v rovnakom riadku v stĺpci Text môžete zadať jednu alebo viac značiek. Môžete tiež nechať stĺpec Značky prázdny.

  • Ak ste vo vzorke textu identifikovali viacero značiek, uveďte ich ako text s oddeľovačmi v poli Značky . Oddeľovače sú v súčasnosti podporované čiarkami (,), bodkočiarkami (;) a znakmi tabulátora.

    Text Značky
    Skvelá čistá a tichá izba s bezplatnými raňajkami Jedáleň
    Malá, ale dobre zorganizovaná miestnosť, ktorá bola pohodlná Miestnosť
    Milujem výhľad z 13. poschodia (žiadne)
  • Uistite sa, že pre každú značku, ktorú chcete extrahovať, máte k dispozícii minimálne 10 rôznych textových ukážok. Štítky s menej ako 10 vzorkami nebudú vyškolené. V predchádzajúcom príklade by malo byť minimálne 10 riadkov, z ktorých každý bol označený značkou Jedáleň a Izba značky.

  • Ak Miestnosť bola označená v menej ako 10 riadkoch v údajoch, bude sa ignorovať. Model nebude vyškolený na kategorizáciu údajov pre túto značku.

  • Pre každú značku, ktorá sa použije, poskytnite minimálne 10 ukážok textu, kde sa nepoužíva .

    Text Značky
    Skvelá čistá a tichá izba s bezplatnými raňajkami Miestnosť
    Malá, ale dobre zorganizovaná miestnosť, ktorá bola pohodlná Miestnosť
    (žiadne) Miestnosť

    Ak sú všetky riadky v tabuľke označené ako Miestnosť a neexistujú žiadne riadky (alebo menej ako 10 riadkov), ktoré by boli označené iným štítkom, model zlyhá tréningový proces.

  • Tabuľka musí mať najmenej dve značky a každá z nich musí mať 10 ukážok textu.

  • Môžete definovať až 200 rôznych značiek. Každá značka je kategória, ktorá bude identifikovaná a extrahovaná z daného textu.

  • Každá vzorka textových údajov musí mať menej ako 5 000 znakov.

Ak nemáte tréningové údaje a chcete vyskúšať AI Builder klasifikáciu kategórií, postupujte podľa týchto pokynov na použitie vzorových údajov.

Príklady formátu školiacich údajov

Táto časť poskytuje príklady formátu školiacich údajov v tabuľke Dataverse.

Stĺpce Typ údajov Veľkosť
Vytvoril Text 3,000
Značky Text 100



Vytvoril Značky
Počas pobytu som bol úplne ignorovaný. Zamestnanci ma nedokázali vyzdvihnúť
aspiruje a má UTI. Tiež som mal zápal pľúc.
Starostlivosť
Bol som videný veľmi skoro po príchode zakaždým a všetok personál, zdravotná sestra, lekár,
a anesteziológ boli veľmi nápomocní. Zdá sa, že je tu dobrý pocit tímovej práce.
Personál, vstupná kontrola
Vybavenie sa zdalo byť aktuálne. Zdá sa, že zdravotná sestra/zdravotnícky asistent
boli celkom starostlivý.
Vybavenie, personál

Poznámka

Ak nemáte vlastné tréningové údaje a chcete vyskúšať AI Builder klasifikáciu kategórií, môžete začať stiahnutím vzorových údajov pre model klasifikácie kategórií. Ďalšie informácie: Na klasifikáciu kategórií použite vzorové údaje

Importujte svoje údaje do Dataverse

Pretože školiace údaje pre model klasifikácie kategórií musia byť dostupné ako tabuľka Dataverse, začneme s prípravou údajov v tabuľke Dataverse.

Dataverse obsahuje výkonnú množinu konektorov, ktoré vám pomôžu importovať údaje z mnohých zdrojov. Ďalšie informácie: Pridajte údaje do tabuľky v Microsoft Dataverse pomocou Power Query.

Ako príklad môžete takto importovať tréningové údaje z hárka Excel. V tomto príklade sa používa súbor, ktorý obsahuje údaje uvedené v nasledujúcej tabuľke.

Identifikátor Značky Text
1 Stolovanie S raňajkami boli trochu problémy.
2 Jedáleň Skvelá čistá a tichá izba s bezplatnými raňajkami.
3 Izba, stolovanie, poloha Personál, s ktorým sme sa stretli, bol veľmi priateľský a ochotný. Chodby a naša izba boli čisté a pohodlné. Raňajky (v cene) boli muffiny a rožky.
4 Poloha, stolovanie Okolie je plné barov a reštaurácií. 
5 Service Personál bol úctivý.

V tomto prípade sú značky oddelené čiarkou (,). Ako alternatívu môžete použiť bodkočiarku (;) alebo tabulátor.

  1. Prihlásiť sa do Power Apps.

  2. Zvoľte si prostredie, v ktorom chcete pracovať.

    Snímka obrazovky s výberom prostredia.

  3. Vyberte Údaje>Tabuľky.

  4. Výber tabuľky. Ak ešte nemáte tabuľku, postupujte podľa krokov v Vytvorenie vlastnej tabuľky.

  5. Na páse s nástrojmi vybranej tabuľky vyberte Údaje>Získať údaje>Získať údaje z Excelu .

    Snímka obrazovky zobrazujúca Získanie údajov z Excelu.

  6. Na obrazovke Importovať údaje vyberte súbor Excel, ktorý obsahuje údaje uvedené v Príklady formátu tréningových údajov časti vyššie v tejto téme a potom vyberte Nahrať.

    Snímka obrazovky nahrávania súboru Excel.

  7. Ak chcete skontrolovať mapovania polí na obrazovke Mapovania stĺpcov pre kategóriu textu , vyberte Stĺpce mapy.

    Snímka obrazovky zobrazujúca mapovania stĺpcov pre kategóriu textu.

    Na ľavej strane sú uvedené všetky stĺpce definované v tabuľke. Rozbaľovací zoznam vpravo zobrazuje stĺpce dostupné v súbore Excel.

    Mapujte značky , Text a Id stĺpcov z Excelu do príslušných stĺpcov v tabuľke.

  8. Po namapovaní stĺpcov sa vráťte ku kroku importu výberom možnosti Uložiť zmeny v pravom hornom rohu.

    Snímka obrazovky s uložením zmien.

  9. Keď uvidíte Stav mapovania ako úspešný, začnite proces importu výberom možnosti Importovať v pravom hornom rohu.

    Snímka obrazovky spustenia procesu importu výberom tlačidla Importovať.

  10. Proces importu môže v závislosti od množstva importovaných údajov trvať niekoľko minút. Po niekoľkých minútach obnovte kartu Údaje v tabuľke, aby ste našli všetky záznamy importované zo súboru Excel.

Teraz ste pripravení prejsť na ďalší krok.

Ďalší krok

Vytvorte model klasifikácie kategórií