Enne kategoorialiigituse mudeli loomist
Enne kategooria klassifikatsioonimudeli koostamist veenduge, et teie andmed oleksid õiges vormingus Microsoft Dataverse .
eeltingimused
See mudel nõuab, et treeninguandmed oleksid tabelis saadaval Dataverse . Välistest allikatest pärinevate andmete tugi pole praegu saadaval.
Veenduge, et administraator on määranud teile treeninguandmeid sisaldava tabeli lugemisõigusega turberoll.
Veenduge, et teil oleks keskkonnas Power Platform tabelite loomiseks sobivad õigused. Saate kasutada sisseehitatud turberolle Süsteemikohandaja või Süsteemiadministraator.
Toetatud keeled
AI Builder Kategooria klassifikatsioon toetab järgmisi keeli. Kui proovite teksti liigitada teistesse keeltesse, ei pruugi teie mudel korralikult töötada.
- Inglise keel
- prantsuse
- saksa
- itaalia
- hispaania
- portugali
Andmete ettevalmistamine
Tabelis esitatud mudeli Dataverse treenimiseks kasutatavad treeningandmed peaksid vastama järgmistele nõuetele:
Teksti ja siltide talletamine kahe veeruna samas tabelis. Igal real peavad olema andmed veerus Tekst .
Saate lisada ühe või mitu silti samal real olevatele andmetele veerus Tekst . Samuti võite veeru Sildid tühjaks jätta .
Kui olete tekstinäidises tuvastanud mitu silti, sisestage need eraldatud tekstina väljadele Sildid . Praegu on komade (,), semikoolonite (;)) ja tabeldusmärkide eraldajad toetatud.
Tekstsõnum Sildid Suurepärane puhas ja vaikne tuba, kus on tasuta hommikusöök Söögituba Väike, kuid hästi orkestreeritud ruum, mis oli mugav Ruum Mulle meeldib vaade 13. korruselt (pole) Veenduge, et iga ekstraktitava sildi jaoks oleks vähemalt 10 erinevat tekstinäidist. Vähem kui 10 näidisega silte ei koolitata. Eelmises näites oleks pidanud olema vähemalt 10 rida, millest igaüks on sildistatud siltidega Söögituba ja tuba .
Kui ruum on andmetes sildistatud vähem kui 10 reale, siis seda ignoreeritakse. Mudelit ei treenita selle sildi andmeid kategoriseerima.
Sisestage iga kasutatava sildi kohta vähemalt 10 tekstinäidist, kus seda ei kasutata.
Tekstsõnum Sildid Suurepärane puhas ja vaikne tuba, kus on tasuta hommikusöök Ruum Väike, kuid hästi orkestreeritud ruum, mis oli mugav Ruum (pole) Ruum Kui kõik tabeliread on sildistatud väärtusele Ruum ja pole ühtegi rida või vähem kui 10 rida, mis on sildistatud teisele sildile, siis mudel ei läbi treeningprotsessi.
Tabelis peab olema vähemalt kaks silti ja igal neist peab olema 10 tekstinäidist.
Saate määratleda kuni 200 erinevat silti. Iga silt on kategooria, mis identifitseeritakse ja eraldatakse antud tekstist.
Iga tekstiandmete näidis peab sisaldama vähem kui 5,000 tähemärki.
Kui teil pole treeninguandmeid ja soovite proovida AI Builder kategooriaklassifikatsiooni, järgige näidisandmete kasutamiseks neid juhiseid .
Treeninguandmete vormingu näited
Selles jaotises on toodud näiteid treeninguandmete vormingu kohta tabelis Dataverse .
Tulbad | Andmetüüp | Maht |
---|---|---|
Kommentaarid | Tekstsõnum | 3,000 |
Sildid | Tekstsõnum | 100 |
Kommentaarid | Sildid |
---|---|
Minu viibimise ajal ignoreeriti mind täielikult. Töötajad ei suutnud mulle järele tulla Aspireeriv ja UTI omamine. Mul oli ka kopsupõletik. |
Hooldus |
Mind nähti väga varsti pärast iga kord saabumist ja kogu personali, õde, arsti, Ja anestesioloog oli väga abivalmis. Tundub, et meeskonnatöö tunne on hea. |
Personal, lennule registreerimine |
Varustus tundus ajakohane. Õde/tervishoiutöötaja tundus üsna hooliv. |
Ruumid, personal |
Märkus.
Kui teil pole oma treeninguandmeid ja soovite proovida AI Builder kategooriate klassifitseerimist, saate alustuseks alla laadida kategooria klassifitseerimismudeli näidisandmed. Lisateave: Näidisandmete kasutamine kategooria klassifitseerimiseks
Importige oma andmed Dataverse
Kuna kategooria klassifitseerimise mudeli koolitusandmed peavad olema saadaval tabelina Dataverse , alustame andmete ettevalmistamisest tabelis Dataverse .
Dataverse sisaldab võimsat konnektorite komplekti, mis aitab teil andmeid paljudest allikatest importida. Lisateave: andmete lisamine tabelisse Microsoft Dataverse , kasutades Power Query.
Näiteks vaatame, kuidas importida koolitusandmeid Exceli töövihikust. Selles näites kasutatakse faili, mis sisaldab järgmises tabelis kuvatut.
ID | Sildid | Tekstsõnum |
---|---|---|
1 | Einestamine | Hommikusöök oli natuke tülikas. |
2 | Söögituba | Suurepärane puhas ja vaikne tuba, kus on tasuta hommikusöök. |
3 | Tuba, Söögituba, Asukoht | Töötajad, kellega suhtlesime, olid väga sõbralikud ja abivalmid. Koridorid ja meie tuba olid puhtad ja mugavad. Hommikusöök (hinna sees) oli muffinid ja bagelid. |
4 | Asukoht, Einestamine | Ümbruskond on täis baare ja restorane. |
5 | Hooldus | Töötajad olid lugupidavad. |
Näites eraldatakse sildid komaga (,). Teise võimalusena võite kasutada semikoolonit (;) või tabeldusmärki.
Logige sisse rakendusse Power Apps.
Valige keskkond, milles soovite töötada.
Valige Andmetabelid>.
Valige oma tabel. Kui teil pole veel tabelit, järgige teemas Kohandatud tabeli loomine toodud juhiseid.
Andmete valimine>Andmete toomine>Excelist andmete toomiseks valitud tabeli lindilt.
Valige kuval Andmete importimine Exceli fail, mis sisaldab selle teema eespool jaotises Treeninguandmete vormingu näited viidatud andmeid, ja seejärel valige Laadi üles.
Väljavastenduste ülevaatamiseks kuval Veeruvastendused tekstikategooria jaoks valige suvand Kaardista veerud.
Vasakul pool on loetletud kõik tabelis määratletud veerud. Paremal asuv ripploend näitab Exceli failis saadaolevaid veerge.
Vastendage veerud Sildid, Tekst ja Id Excelist tabeli vastavate veergudega.
Pärast veergude vastendamist naaske importimisetapi juurde, valides paremas ülanurgas käsu Salvesta muudatused .
Kui vastendamise olek on õnnestunud, alustage importimist, valides paremas ülanurgas käsu Impordi.
Impordiprotsess võib sõltuvalt imporditavate andmete mahust võtta paar minutit. Mõne minuti pärast värskendage tabeli vahekaarti Andmed , et leida kõik Exceli failist imporditud kirjed.
Nüüd olete valmis astuma järgmise sammu juurde.