Aangepaste neurale spraak lite (preview)
Azure AI Speech biedt twee aangepaste cnv-projecttypen (neurale spraak): CNV lite en CNV professional.
- Met CNV-professional (Custom Neural Voice) kunt u uw trainingsgegevens uploaden die zijn verzameld via professionele opnamestudio's en een spraak van hogere kwaliteit maken die bijna niet te onderscheiden is van de menselijke monsters. CNV-professionele toegang is beperkt op basis van geschiktheids- en gebruikscriteria. Vraag toegang aan op het intakeformulier.
- Custom Neural Voice (CNV) lite is een projecttype in openbare preview. U kunt aangepaste neurale stem demo's en evalueren voordat u in professionele opnamen investeert om een spraak met een hogere kwaliteit te maken. Er is geen toepassing vereist voor demo- en evaluatiedoeleinden. Microsoft beperkt en selecteert echter de opname- en testvoorbeelden voor gebruik met CNV lite. U moet volledige toegang tot CNV-professionals aanvragen om het CNV Lite-model te implementeren en te gebruiken voor bedrijfsdoeleinden. In dat geval vraagt u toegang aan op het intakeformulier.
Met een CNV lite-project neemt u uw stem online op door 20-50 vooraf gedefinieerde scripts van Microsoft te lezen. Nadat u ten minste 20 voorbeelden hebt opgenomen, kunt u beginnen met het trainen van een model. Zodra het model is getraind, kunt u het model controleren en 20 uitvoervoorbeelden bekijken die worden geproduceerd met een andere set vooraf gedefinieerde scripts.
Bekijk de ondersteunde talen voor aangepaste neurale spraak.
Projecttypen vergelijken
De volgende tabel bevat een overzicht van de belangrijkste verschillen tussen de projecttypen CNV lite en CNV Professional.
Artikelen | Lite (preview) | PRO |
---|---|---|
Doelscenario 's | Demonstratie of evaluatie | Professionele scenario's zoals merk- en karakterstemmen voor chatbots of het lezen van audio-inhoud. |
Trainingsgegevens | Online opnemen met Speech Studio | Bring Your Own Data. Opname in een professionele studio wordt aanbevolen. |
Scripts voor opname | Geleverd in Speech Studio | Gebruik uw eigen scripts die overeenkomen met het use-casescenario. Microsoft biedt voorbeeldscripts voor naslaginformatie. |
Vereiste gegevensgrootte | 20-50 utterances | 300-2000 utterances |
Trainingstijd | Minder dan één rekenuur | Ongeveer 20-40 rekenuren |
Spraakkwaliteit | Gemiddelde kwaliteit | Hoge kwaliteit |
Beschikbaarheid | Iedereen kan voorbeelden online opnemen en een model trainen voor demo- en evaluatiedoeleinden. Volledige toegang tot aangepaste neurale spraak is vereist als u het CNV Lite-model wilt implementeren voor zakelijk gebruik. | Het uploaden van gegevens is niet beperkt, maar u kunt alleen een CNV-professioneel model trainen en implementeren nadat de toegang is goedgekeurd. CNV-professionele toegang is beperkt op basis van geschiktheids- en gebruikscriteria. Vraag toegang aan op het intakeformulier. |
Prijzen | De prijzen per eenheid zijn evenzeer van toepassing op de CNV lite- en CNV-professionele projecten. Bekijk hier de prijsgegevens. | De prijzen per eenheid zijn evenzeer van toepassing op de CNV lite- en CNV-professionele projecten. Bekijk hier de prijsgegevens. |
Een aangepast neurale spraak lite-project maken
Volg deze stappen om een aangepast neurale spraak lite-project te maken:
Meld u aan bij Speech Studio.
Selecteer het abonnement en de Spraak-resource waarmee u wilt werken.
Selecteer Aangepaste stem>Een project maken.
Selecteer Aangepaste neurale stem lite>Volgende. Zie Een project maken voor aangepaste neurale spraak om in plaats daarvan een aangepast neurale spraakproject te maken.
Volg de instructies van de wizard om uw project te maken.
Belangrijk
Het CNV lite-project verloopt na 90 dagen tenzij de mondelinge verklaring die is opgenomen door het stemtalent wordt ingediend.
Selecteer het nieuwe project op naam of selecteer Ga naar project. U ziet deze menu-items in het linkerdeelvenster: Record and build, Review model, and Deploy model.
Een CNV Lite-model opnemen en bouwen
Neem ten minste 20 spraakvoorbeelden (maximaal 50) online op met opgegeven scripts. Spraakvoorbeelden die hier worden opgenomen, worden gebruikt om een synthetische versie van uw stem te maken.
Notitie
Aangepaste neurale spraaktraining is momenteel alleen beschikbaar in sommige regio's. Zie voetnoten in de tabel regio's voor meer informatie.
Hier volgen enkele tips om uw spraakvoorbeelden op te nemen:
- Gebruik een goede microfoon. Vergroot de helderheid van uw voorbeelden met behulp van een microfoon van hoge kwaliteit. Spreek over 8 inch afstand van de microfoon om mondgeluiden te voorkomen.
- Vermijd achtergrondgeluiden. Neem op in een rustige ruimte zonder achtergrondgeluid of echo.
- Ontspan en spreek natuurlijk. Laat uzelf emoties uitdrukken terwijl u de zinnen leest.
- Leg vast in één take. Als u een consistent energieniveau wilt behouden, noteert u alle zinnen in één sessie.
- Spreek elk woord correct uit en spreek duidelijk.
Volg deze stappen om een CNV lite-model op te nemen en te bouwen:
- Selecteer Aangepaste stem> Uw projectnaam >opnemen en bouwen.
- Selecteer Aan de slag.
- Lees de gebruiksvoorwaarden van Voice talent zorgvuldig door. Schakel het selectievakje in om de gebruiksvoorwaarden te bevestigen.
- Accepteren selecteren
- Druk op het microfoonpictogram om de ruiscontrole te starten. Deze ruiscontrole duurt slechts een paar seconden en u hoeft er niet tijdens te spreken.
- Als er ruis is gedetecteerd, kunt u Opnieuw controleren selecteren om de ruiscontrole te herhalen. Als er geen ruis is gedetecteerd, kunt u Gereed selecteren om door te gaan naar de volgende stap.
- Bekijk de opnametips en selecteer Downloaden. Voor de beste resultaten gaat u naar een rustig gebied zonder achtergrondgeluid voordat u uw stemvoorbeelden opneemt.
- Druk op het microfoonpictogram om de opname te starten.
- Druk op het stoppictogram om de opname te stoppen.
- Bekijk de metrische gegevens van de kwaliteit. Nadat u elk voorbeeld hebt opgenomen, controleert u de kwaliteit van het voorbeeld voordat u verdergaat met de volgende.
- Noteer meer voorbeelden. Hoewel u een model met slechts 20 voorbeelden kunt maken, is het raadzaam dat u maximaal 50 opneemt om een betere kwaliteit te krijgen.
- Selecteer Train model om het trainingsproces te starten.
Het trainingsproces duurt ongeveer één rekenuur. U kunt de voortgang van het trainingsproces controleren op de pagina Model controleren .
Model controleren
Volg deze stappen om het CNV lite-model te bekijken en naar uw eigen synthetische stem te luisteren:
- Selecteer Aangepaste stem> Uw projectnaam >Beoordelingsmodel. Hier kunt u de naam van het spraakmodel, de modeltaal, de grootte van voorbeeldgegevens en de voortgang van de training bekijken. De spraaknaam bestaat uit het woord 'Neural' dat is toegevoegd aan uw projectnaam.
- Selecteer de naam van het spraakmodel om de modeldetails te bekijken en luister naar de voorbeeldtekst naar spraakresultaten.
- Selecteer het afspeelpictogram om uw stem elk script te laten uitspreken.
Mondelinge verklaring verzenden
Er is een mondelinge verklaring van het spraaktalent vereist voordat u het model voor uw bedrijf kunt implementeren.
Voer de volgende stappen uit om de mondelinge verklaring voor spraaktalent in te dienen:
- Selecteer Custom voice> Your project name >Deploy model>Manage your voice talent.
- Selecteer het model.
- Voer de naam van het stemtalent en de bedrijfsnaam in.
- Lees en noteer de instructie. Selecteer het microfoonpictogram om de opname te starten. Selecteer het stoppictogram om de opname te stoppen.
- Selecteer Verzenden om de instructie in te dienen.
- Controleer de verwerkingsstatus in de scripttabel onderaan het dashboard. Zodra de status Geslaagd is, kunt u het model implementeren.
Model implementeren
Als u uw spraakmodel wilt implementeren en gebruiken in uw toepassingen, moet u volledige toegang krijgen tot aangepaste neurale spraak. Vraag toegang aan op het intakeformulier. Binnen ongeveer 10 werkdagen ontvangt u een e-mail met de goedkeuringsstatus. Er is ook een mondelinge verklaring van het spraaktalent vereist voordat u het model voor uw bedrijf kunt implementeren.
Voer de volgende stappen uit om een CNV lite-model te implementeren:
- Selecteer Aangepaste stem> Uw projectnaam> Model implementeren model> implementeren.
- Selecteer de naam van een spraakmodel en selecteer vervolgens Volgende.
- Voer een naam en beschrijving in voor uw eindpunt en selecteer vervolgens Volgende.
- Schakel het selectievakje in om akkoord te gaan met de gebruiksvoorwaarden en selecteer vervolgens Volgende.
- Selecteer Implementeren om het model te implementeren.
Vanaf hier kunt u het CNV Lite-spraakmodel op dezelfde manier gebruiken als u een PROFESSIONEEL CNV-spraakmodel zou gebruiken. U kunt bijvoorbeeld een eindpunt onderbreken of hervatten nadat het is gemaakt, om uitgaven te beperken en resources te besparen die niet in gebruik zijn. U hebt ook toegang tot de stem in het hulpprogramma Voor het maken van audio-inhoud in Speech Studio.