Egyéni neurális hang lite (előzetes verzió)
Az Azure AI Speech két egyéni neurális (CNV) projekttípust biztosít: a CNV lite és a CNV professional projekttípust.
- Az egyéni neurális hang (CNV) szakember lehetővé teszi, hogy feltöltse a professzionális stúdiókon keresztül gyűjtött betanítási adatokat, és egy olyan jobb minőségű hangot hozzon létre, amely szinte megkülönböztethetetlen az emberi mintáitól. A CNV szakmai hozzáférése a jogosultsági és használati feltételek alapján korlátozott. Hozzáférés kérése a beviteli űrlapon.
- Az egyéni neurális hang (CNV) lite egy projekttípus a nyilvános előzetes verzióban. Az egyéni neurális hangokat bemutató és értékelhető, mielőtt professzionális felvételekbe fektetett, hogy jobb minőségű hangot hozzon létre. Demó- és kiértékelési célokra nincs szükség alkalmazásra. A Microsoft azonban korlátozza és kiválasztja a CNV Lite-hoz használható rögzítési és tesztelési mintákat. A CNV lite modell üzleti célú üzembe helyezéséhez és használatához teljes hozzáférést kell kérnie a CNV-szakemberhez. Ebben az esetben kérjen hozzáférést a beviteli űrlapon.
A CNV Lite-projekttel online rögzítheti a hangját a Microsoft által biztosított 20-50 előre definiált szkript olvasásával. Miután legalább 20 mintát rögzített, megkezdheti a modell betanítását. A modell sikeres betanítása után áttekintheti a modellt, és megtekintheti az előre definiált szkriptek egy másik készletével előállított 20 kimeneti mintát.
Az egyéni neurális hang támogatott nyelveinek megtekintése.
Projekttípusok összehasonlítása
Az alábbi táblázat a CNV lite és a CNV professional projekttípusok közötti főbb különbségeket foglalja össze.
Elemek | Lite (előzetes verzió) | Profi |
---|---|---|
Célforgatókönyvek | Bemutató vagy értékelés | Olyan professzionális forgatókönyvek, mint például a csevegőrobotok márka- és karakterhangjai, vagy a hangtartalmak olvasása. |
Betanítási adatok | Online rögzítés a Speech Studióval | Hozza magával a saját adatait. Professzionális stúdióban való felvétel ajánlott. |
Szkriptek felvételhez | Megadva a Speech Studióban | Használjon saját szkripteket, amelyek megfelelnek a használati eset forgatókönyvének. A Microsoft példaszkripteket kínál referenciaként. |
Szükséges adatméret | 20-50 kimondott szöveg | 300-2000 kimondott szöveg |
Betanítási idő | Kevesebb mint egy számítási óra | Körülbelül 20–40 számítási óra |
Hangminőség | Közepes minőség | Magas minőség |
Elérhetőség | Bárki rögzíthet mintákat online, és betanított egy modellt bemutató és kiértékelési célokra. Az egyéni neurális hanghoz való teljes hozzáférésre van szükség, ha a CNV lite modellt üzleti használatra szeretné üzembe helyezni. | Az adatfeltöltés nincs korlátozva, de csak a hozzáférés jóváhagyása után taníthat be és helyezhet üzembe egy CNV-alapú professzionális modellt. A CNV szakmai hozzáférése a jogosultsági és használati feltételek alapján korlátozott. Hozzáférés kérése a beviteli űrlapon. |
Díjszabás | Egységárak egyformán érvényesek mind a CNV lite, mind a CNV szakmai projektekre. Itt megtekintheti a díjszabás részleteit. | Egységárak egyformán érvényesek mind a CNV lite, mind a CNV szakmai projektekre. Itt megtekintheti a díjszabás részleteit. |
Egyéni neurális hangprojekt létrehozása
Egyéni neurális hangalapú lite projekt létrehozásához kövesse az alábbi lépéseket:
Jelentkezzen be a Speech Studióba.
Válassza ki azt az előfizetést és speech-erőforrást, amellyel dolgozni szeretne.
Válassza az Egyéni hang>projekt létrehozása lehetőséget.
Válassza az Egyéni neurális hang lite>Tovább lehetőséget. Ha inkább egyéni neurális hangprojektet szeretne létrehozni, olvassa el a Projekt létrehozása egyéni neurális hanghoz című témakört.
A projekt létrehozásához kövesse a varázsló utasításait.
Fontos
A CNV lite projekt 90 nap után lejár, kivéve, ha a hangtehetség által rögzített szóbeli nyilatkozatot nem küldik el.
Válassza ki az új projektet név szerint, vagy válassza az Ugrás a projekthez lehetőséget. A bal oldali panelen a következő menüelemek láthatók: Rekord és build, Modell áttekintése és Üzembe helyezés.
CNV Lite-modell rögzítése és létrehozása
Rögzítsen legalább 20 hangmintát (legfeljebb 50) a megadott szkriptekkel online. Az itt rögzített hangminták a hang szintetikus verziójának létrehozásához használhatók.
Feljegyzés
Az egyéni neurális hangképzés jelenleg csak bizonyos régiókban érhető el. További információkért tekintse meg a Régiók táblában található lábjegyzeteket.
Az alábbiakban néhány tippet talál a hangminták rögzítéséhez:
- Használjon jó mikrofont. Kiváló minőségű mikrofonnal javíthatja a minták tisztaságát. Beszéljen körülbelül 8 hüvelyk távolságra a mikrofontól, hogy elkerülje a szájzajokat.
- Kerülje a háttérzajt. Rögzítsen egy csendes helyiségben háttérzaj vagy visszhang nélkül.
- Lazítson és beszéljen természetesen. Hagyja, hogy kifejezze érzelmeit, miközben elolvassa a mondatokat.
- Rekord egy felvételben. A konzisztens energiaszint megőrzése érdekében minden mondatot rögzíthet egy munkamenetben.
- Az egyes szavakat helyesen kell kimondani, és világosan beszélni.
CNV Lite-modell rögzítéséhez és létrehozásához kövesse az alábbi lépéseket:
- Válassza az Egyéni hang> a projekt neve >Rekord és build lehetőséget.
- Válassza az Első lépések lehetőséget.
- Olvassa el figyelmesen a Voice-tehetségek használati feltételeit. Jelölje be a jelölőnégyzetet a használati feltételek nyugtázásához.
- Válassza az Elfogadás lehetőséget
- A zajellenőrzés elindításához nyomja le a mikrofon ikont. Ez a zajellenőrzés csak néhány másodpercet vesz igénybe, és nem kell beszélnie közben.
- Ha zajt észlelt, a zajellenőrzés ismételt megismétléséhez válassza az Ellenőrzés lehetőséget . Ha nem észlelt zajt, a Kész elemet választva továbbléphet a következő lépésre.
- Tekintse át a rögzítési tippeket, és válassza a Got it (Megvan) lehetőséget. A legjobb eredmény érdekében a hangminták rögzítése előtt lépjen egy csendes, háttérzaj nélküli területre.
- A felvétel indításához nyomja le a mikrofon ikont.
- A rögzítés leállításához nyomja le a leállítás ikont.
- Minőségi metrikák áttekintése. Az egyes minták rögzítése után ellenőrizze a minőségi metrikát, mielőtt továbblép a következőre.
- További mintákat rögzít. Bár mindössze 20 mintával hozhat létre modellt, ajánlott akár 50-et is rögzíteni a jobb minőség érdekében.
- A betanítási folyamat elindításához válassza a Betanítási modell lehetőséget.
A betanítási folyamat körülbelül egy számítási órát vesz igénybe. A betanítási folyamat előrehaladását a Modell áttekintése lapon ellenőrizheti.
Modell áttekintése
A CNV lite modell áttekintéséhez és a saját szintetikus hangjának meghallgatásához kövesse az alábbi lépéseket:
- Válassza ki az Egyéni hang> a projektnév >felülvizsgálati modelljét. Itt áttekintheti a hangmodell nevét, a modell nyelvét, a mintaadatok méretét és a betanítás előrehaladását. A hangnév a projekt nevéhez fűzött "Neurális" szóból áll.
- A hangmodell nevének kiválasztásával áttekintheti a modell részleteit, és meghallgathatja a beszéderedmények mintaszövegét.
- Válassza a lejátszás ikont, ha hallani szeretné, hogy a hang beszéljen az egyes szkriptek között.
Szóbeli nyilatkozat elküldése
A hangtehetség által rögzített szóbeli nyilatkozatra van szükség, mielőtt üzembe helyezheti a modellt az üzleti használatra.
A hangtehetség szóbeli nyilatkozatának elküldéséhez kövesse az alábbi lépéseket:
- Egyéni hang kiválasztása A projekt neve >Üzembe helyezési modell>A hangtehetség kezelése.>
- Válassza ki a modellt.
- Adja meg a hangtehetség nevét és a vállalat nevét.
- Olvassa el és rögzítse az utasítást. Válassza a mikrofon ikont a felvétel elindításához. A rögzítés leállításához válassza a leállítás ikont.
- Válassza a Küldés lehetőséget az utasítás elküldéséhez.
- Ellenőrizze a feldolgozás állapotát az irányítópult alján található szkripttáblában. Ha az állapot sikeres, üzembe helyezheti a modellt.
Modell üzembe helyezése
A hangmodell üzembe helyezéséhez és az alkalmazásokban való használatához teljes hozzáférést kell kapnia az egyéni neurális hanghoz. Hozzáférés kérése a beviteli űrlapon. Körülbelül 10 munkanapon belül e-mailt kap a jóváhagyási állapotról. A hangtehetség által rögzített szóbeli nyilatkozatra is szükség van, mielőtt üzembe helyezheti a modellt az üzleti használatra.
CNV Lite-modell üzembe helyezéséhez kövesse az alábbi lépéseket:
- Válassza az Egyéni hang>: A projekt neve> Üzembe helyezési modell>üzembe helyezése modell.
- Válassza ki a hangmodell nevét, majd válassza a Tovább gombot.
- Adja meg a végpont nevét és leírását, majd válassza a Tovább gombot.
- Jelölje be a jelölőnégyzetet a használati feltételek elfogadásához, majd válassza a Tovább gombot.
- Válassza az Üzembe helyezés lehetőséget a modell üzembe helyezéséhez.
Innen ugyanúgy használhatja a CNV lite hangmodellt, mint a CNV professzionális hangmodellt. Például felfüggeszthet vagy folytathat egy végpontot a létrehozása után, és korlátozhatja a használaton nem lévő erőforrásokat. A hang a Speech Studióban a Hangtartalom létrehozása eszközben is elérhető.