Preden zgradite model klasifikacije kategorij
Preden zgradite svoj model klasifikacije kategorij, se prepričajte, da so vaši podatki v Microsoft Dataverse in da so strukturirani v pravilni obliki.
Zahteve
Ta model zahteva, da so podatki o usposabljanju na voljo v Dataverse tabeli. Podpora za podatke iz zunanjih virov trenutno ni na voljo.
Prepričajte se, da vam je skrbnik dodelil varnostna vloga s privilegijem za branje za tabelo, ki vsebuje podatke o usposabljanju.
Prepričajte se, da imate ustrezna dovoljenja za ustvarjanje tabel v svojem Power Platform okolju. Uporabite lahko vgrajene varnostne vloge System Customizer ali System Administrator.
Podprti jeziki
AI Builder klasifikacija kategorij podpira naslednje jezike. Če poskušate klasificirati besedilo v drugih jezikih, vaš model morda ne bo deloval pravilno.
- English
- francoščina
- nemščina
- italijanščina
- španščina
- portugalščina
Priprava podatkov
Podatki o usposabljanju, uporabljeni za usposabljanje modela iz Dataverse tabele, morajo ustrezati naslednjemu:
Shranite besedilo in oznake kot dva stolpca v isti tabeli. Vsaka vrstica mora imeti podatke v stolpcu Besedilo .
Podatkom v isti vrstici v stolpcu Besedilo lahko podate eno ali več oznak. Prav tako lahko pustite Oznake stolpec prazen.
Če ste v vzorcu besedila identificirali več oznak, jih navedite kot ločeno besedilo v poljih Oznake . Trenutno so podprta ločila vejice (,), podpičja (;) in tabulatorji.
SMS-a Oznake Odlična čista in tiha soba z brezplačnim zajtrkom za na pot Jedilnica Majhna, a dobro urejena soba, ki je bila udobna Soba Všeč mi je pogled iz 13. nadstropja (brez) Prepričajte se, da imate najmanj 10 različnih vzorcev besedila za vsako oznako, ki jo želite ekstrahirati. Oznake z manj kot 10 vzorci ne bodo usposobljene. V prejšnjem primeru je moralo biti najmanj 10 vrstic, ki so bile označene z jedilnico in sobo oznake.
Če je Soba označena v manj kot 10 vrsticah podatkov, bo prezrta. Model ne bo usposobljen za kategorizacijo podatkov za to oznako.
Za vsako oznako, ki se uporablja, zagotovite najmanj 10 vzorcev besedila, kjer se ne uporablja.
SMS-a Oznake Odlična čista in mirna soba z brezplačnim zajtrkom Soba Majhna, a dobro urejena soba, ki je bila udobna Soba (brez) Soba Če so vse vrstice v tabeli označene z Soba in ni nobene vrstice – ali manj kot 10 vrstic – ki so bile označene z drugo oznako, model ne bo uspel proces usposabljanja.
Tabela mora imeti vsaj dve oznaki, vsaka pa mora imeti 10 vzorcev besedila.
Določite lahko do 200 različnih oznak. Vsaka oznaka je kategorija, ki bo identificirana in ekstrahirana iz danega besedila.
Vsak vzorec besedilnih podatkov mora imeti manj kot 5000 znakov.
Če nimate podatkov o usposabljanju in želite preizkusiti AI Builder razvrstitev po kategorijah, sledite tem navodilom za uporabo vzorčnih podatkov.
Primeri formata podatkov o usposabljanju
V tem razdelku so primeri zapisa podatkov o usposabljanju v Dataverse tabeli.
Št. stolpcev | Podatkovni tip | Velikost |
---|---|---|
Comments | SMS-a | 3,000 |
Oznake | SMS-a | 100 |
Comments | Oznake |
---|---|
Med bivanjem sem bil popolnoma prezrt. Osebje me ni sprejelo Aspiracijo in okužbo sečil. Imel sem tudi pljučnico. |
Skrb |
Vsakič so me videli zelo kmalu po prihodu in vse osebje, medicinska sestra, zdravnik, In anestezist sta bila v veliko pomoč. Zdi se, da obstaja dober občutek za timsko delo. |
Osebje, prijava |
Oprema je bila videti sodobna. Zdelo se je, da je medicinska sestra/zdravstvena pomočnica Precej skrben. |
Objekti, osebje |
opomba,
Če nimate lastnih podatkov o usposabljanju in želite preizkusiti AI Builder razvrstitev po kategorijah, lahko začnete s prenosom vzorčnih podatkov za model razvrstitve po kategorijah. Več informacij: Uporabite vzorčne podatke za klasifikacijo kategorij
Uvozite svoje podatke v Dataverse
Ker morajo biti podatki za usposabljanje za model klasifikacije kategorij na voljo kot Dataverse tabela, začnimo s pripravo podatkov v Dataverse tabeli.
Dataverse vključuje zmogljiv nabor priključkov, ki vam pomagajo uvoziti podatke iz številnih virov. Več informacij: Dodajte podatke v tabelo v Microsoft Dataverse z uporabo Power Query.
Za primer si oglejmo, kako uvoziti podatke o usposabljanju iz Excelovega delovnega zvezka. Ta primer uporablja datoteko, ki vsebuje tisto, kar je prikazano v naslednji tabeli.
ID | Oznake | SMS-a |
---|---|---|
1 | Jedilnica | Zajtrk je bil malo težaven. |
2 | Jedilnica | Odlična čista in tiha soba z brezplačnim zajtrkom za na pot. |
3 | Soba, jedilnica, lokacija | Osebje, s katerim smo imeli opravka, je bilo zelo prijazno in ustrežljivo. Hodniki in naša soba so bili čisti in udobni. Zajtrk (vključen) so bili mafini in pecivo. |
4 | Lokacija, restavracija | Okolica je polna barov in restavracij. |
5 | Service | Osebje je bilo spoštljivo. |
V primeru sta oznaki ločeni z vejico (,). Namesto tega lahko uporabite podpičje (;) ali tabulator.
Vpis v storitev Power Apps.
Izberite okolje, v katerem želite delati.
Izberite Podatki>Tabele.
Izberite svojo mizo. Če še nimate tabele, sledite korakom v Ustvarite tabelo po meri.
Izberite Podatki>Pridobi podatke>Pridobi podatke iz Excela na traku izbrane tabele.
Na zaslonu Uvozi podatke izberite Excelovo datoteko s podatki, navedenimi v Primeri zapisa podatkov o usposabljanju prejšnji razdelek v tem tema in nato izberite Naloži.
Če želite pregledati preslikave polj na zaslonu Preslikave stolpcev za kategorijo besedila , izberite Preslikaj stolpce.
Na levi strani so navedeni vsi stolpci, definirani v tabeli. Spustni seznam na desni prikazuje stolpce, ki so na voljo v datoteki Excel.
Preslikaj Oznake, Besedilo in Id stolpce iz Excela v ustrezne stolpce v tabeli.
Ko preslikate stolpce, se vrnite na korak uvoza tako, da izberete Shrani spremembe v zgornjem desnem kotu.
Ko vidite Stanje preslikave kot uspešno, začnite postopek uvoza tako, da izberete Uvozi v zgornjem desnem kotu.
Postopek uvoza lahko traja nekaj minut, odvisno od količine podatkov, ki se uvažajo. Po nekaj minutah osvežite zavihek Podatki v tabeli, da poiščete vse zapise, uvožene iz Excelove datoteke.
Zdaj ste pripravljeni na naslednji korak.