Skôr než vytvoríte model klasifikácie kategórie
Skôr než začnete vytvárať model klasifikácie kategórie, uistite sa, že sa vaše údaje nachádzajú v službe Microsoft Dataverse a že sú štruktúrované v správnom formáte.
Predpoklady
Tento model vyžaduje, aby boli školiace údaje k dispozícii v rámci tabuľky Dataverse. Podpora údajov z externých zdrojov momentálne nie je k dispozícii.
Uistite sa, že vám váš administrátor pridelil rola zabezpečenia s oprávnením na čítanie pre tabuľku, ktorá obsahuje tréningové dáta.
Uistite sa, že máte príslušné povolenia na vytváranie tabuliek vo svojom Power Platform prostredí. Môžete použiť vstavané roly zabezpečenia System Customizer alebo System Administrator.
Podporované jazyky
AI Builder klasifikácia kategórií podporuje nasledujúce jazyky. Ak sa pokúsite klasifikovať text v iných jazykoch, váš model nemusí fungovať správne.
- angličtina
- Francúzština
- Nemčina
- Taliančina
- Španielčina
- Portugalčina
Príprava údajov
Údaje o školení použité na školenie modelu z tabuľky Dataverse by mali zodpovedať nasledujúcemu:
Uložte text a značky ako dva stĺpce v tej istej tabuľke. Každý riadok musí obsahovať údaje v stĺpci Text .
K údajom v rovnakom riadku v stĺpci Text môžete zadať jednu alebo viac značiek. Môžete tiež nechať stĺpec Značky prázdny.
Ak ste vo vzorke textu identifikovali viacero značiek, uveďte ich ako text s oddeľovačmi v poli Značky . Oddeľovače sú v súčasnosti podporované čiarkami (,), bodkočiarkami (;) a znakmi tabulátora.
Text Značky Skvelá čistá a tichá izba s bezplatnými raňajkami Jedáleň Malá, ale dobre zorganizovaná miestnosť, ktorá bola pohodlná Miestnosť Milujem výhľad z 13. poschodia (žiadne) Uistite sa, že pre každú značku, ktorú chcete extrahovať, máte k dispozícii minimálne 10 rôznych textových ukážok. Štítky s menej ako 10 vzorkami nebudú vyškolené. V predchádzajúcom príklade by malo byť minimálne 10 riadkov, z ktorých každý bol označený značkou Jedáleň a Izba značky.
Ak Miestnosť bola označená v menej ako 10 riadkoch v údajoch, bude sa ignorovať. Model nebude vyškolený na kategorizáciu údajov pre túto značku.
Pre každú značku, ktorá sa použije, poskytnite minimálne 10 ukážok textu, kde sa nepoužíva .
Text Značky Skvelá čistá a tichá izba s bezplatnými raňajkami Miestnosť Malá, ale dobre zorganizovaná miestnosť, ktorá bola pohodlná Miestnosť (žiadne) Miestnosť Ak sú všetky riadky v tabuľke označené ako Miestnosť a neexistujú žiadne riadky (alebo menej ako 10 riadkov), ktoré by boli označené iným štítkom, model zlyhá tréningový proces.
Tabuľka musí mať najmenej dve značky a každá z nich musí mať 10 ukážok textu.
Môžete definovať až 200 rôznych značiek. Každá značka je kategória, ktorá bude identifikovaná a extrahovaná z daného textu.
Každá vzorka textových údajov musí mať menej ako 5 000 znakov.
Ak nemáte tréningové údaje a chcete vyskúšať AI Builder klasifikáciu kategórií, postupujte podľa týchto pokynov na použitie vzorových údajov.
Príklady formátu školiacich údajov
Táto časť poskytuje príklady formátu školiacich údajov v tabuľke Dataverse.
Stĺpce | Typ údajov | Veľkosť |
---|---|---|
Vytvoril | Text | 3,000 |
Značky | Text | 100 |
Vytvoril | Značky |
---|---|
Počas pobytu som bol úplne ignorovaný. Zamestnanci ma nedokázali vyzdvihnúť aspiruje a má UTI. Tiež som mal zápal pľúc. |
Starostlivosť |
Bol som videný veľmi skoro po príchode zakaždým a všetok personál, zdravotná sestra, lekár, a anesteziológ boli veľmi nápomocní. Zdá sa, že je tu dobrý pocit tímovej práce. |
Personál, vstupná kontrola |
Vybavenie sa zdalo byť aktuálne. Zdá sa, že zdravotná sestra/zdravotnícky asistent boli celkom starostlivý. |
Vybavenie, personál |
Poznámka
Ak nemáte vlastné tréningové údaje a chcete vyskúšať AI Builder klasifikáciu kategórií, môžete začať stiahnutím vzorových údajov pre model klasifikácie kategórií. Ďalšie informácie: Na klasifikáciu kategórií použite vzorové údaje
Importujte svoje údaje do Dataverse
Pretože školiace údaje pre model klasifikácie kategórií musia byť dostupné ako tabuľka Dataverse, začneme s prípravou údajov v tabuľke Dataverse.
Dataverse obsahuje výkonnú množinu konektorov, ktoré vám pomôžu importovať údaje z mnohých zdrojov. Ďalšie informácie: Pridajte údaje do tabuľky v Microsoft Dataverse pomocou Power Query.
Ako príklad môžete takto importovať tréningové údaje z hárka Excel. V tomto príklade sa používa súbor, ktorý obsahuje údaje uvedené v nasledujúcej tabuľke.
Identifikátor | Značky | Text |
---|---|---|
1 | Stolovanie | S raňajkami boli trochu problémy. |
2 | Jedáleň | Skvelá čistá a tichá izba s bezplatnými raňajkami. |
3 | Izba, stolovanie, poloha | Personál, s ktorým sme sa stretli, bol veľmi priateľský a ochotný. Chodby a naša izba boli čisté a pohodlné. Raňajky (v cene) boli muffiny a rožky. |
4 | Poloha, stolovanie | Okolie je plné barov a reštaurácií. |
5 | Service | Personál bol úctivý. |
V tomto prípade sú značky oddelené čiarkou (,). Ako alternatívu môžete použiť bodkočiarku (;) alebo tabulátor.
Prihlásiť sa do Power Apps.
Zvoľte si prostredie, v ktorom chcete pracovať.
Vyberte Údaje>Tabuľky.
Výber tabuľky. Ak ešte nemáte tabuľku, postupujte podľa krokov v Vytvorenie vlastnej tabuľky.
Na páse s nástrojmi vybranej tabuľky vyberte Údaje>Získať údaje>Získať údaje z Excelu .
Na obrazovke Importovať údaje vyberte súbor Excel, ktorý obsahuje údaje uvedené v Príklady formátu tréningových údajov časti vyššie v tejto téme a potom vyberte Nahrať.
Ak chcete skontrolovať mapovania polí na obrazovke Mapovania stĺpcov pre kategóriu textu , vyberte Stĺpce mapy.
Na ľavej strane sú uvedené všetky stĺpce definované v tabuľke. Rozbaľovací zoznam vpravo zobrazuje stĺpce dostupné v súbore Excel.
Mapujte značky , Text a Id stĺpcov z Excelu do príslušných stĺpcov v tabuľke.
Po namapovaní stĺpcov sa vráťte ku kroku importu výberom možnosti Uložiť zmeny v pravom hornom rohu.
Keď uvidíte Stav mapovania ako úspešný, začnite proces importu výberom možnosti Importovať v pravom hornom rohu.
Proces importu môže v závislosti od množstva importovaných údajov trvať niekoľko minút. Po niekoľkých minútach obnovte kartu Údaje v tabuľke, aby ste našli všetky záznamy importované zo súboru Excel.
Teraz ste pripravení prejsť na ďalší krok.