Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Notitie
Deze functie is momenteel beschikbaar als openbare preview-versie. Deze preview wordt aangeboden zonder een service level agreement en we raden deze niet aan voor productieworkloads. Misschien worden bepaalde functies niet ondersteund of zijn de mogelijkheden ervan beperkt. Zie Aanvullende gebruiksvoorwaarden voor Microsoft Azure-previews voor meer informatie.
In dit artikel leert u hoe u videoomzetting gebruikt met Azure AI Speech in de Azure AI Foundry-portal.
Hint
Probeer videovertaling uit in de Azure AI Foundry-portal voordat u de API gebruikt. Gebruik de REST API voor videoomzetting om videoomzetting in uw toepassingen te integreren. Zie REST API voor videovertaling voor meer informatie over de API.
Vereiste voorwaarden
- Een Azure-abonnement. Als u nog geen abonnement op Azure hebt, maak dan een gratis account aan voordat u begint.
- een AI Foundry-resource voor Spraak in een ondersteunde regio. Als u geen Spraak-resource hebt, maakt u er een in Azure Portal.
- Een Azure Blob Storage--account.
- U hebt een videobestand nodig in .mp4 indeling, kleiner dan 5 GB en korter dan 4 uur. Voor testdoeleinden kunt u het voorbeeldvideobestand van Microsoft gebruiken op https://ai.azure.com/speechassetscache/ttsvoice/VideoTranslation/PublicDoc/SampleData/es-ES-TryOutOriginal.mp4.
- Zorg ervoor dat videovertaling uw bron- en doeltaal ondersteunt.
Videovertaling uitproberen
Volg deze stappen om de demo van de videoomzetting uit te proberen:
Ga naar de modelcatalogus in azure AI Foundry Portal.
Typ en zoek naar 'Azure-AI-Speech' in het zoekvak van de catalogus.
Selecteer Azure-AI-Speech en u gaat naar de pagina met uitproberen van Azure-AI-Speech .
Selecteer spraakmogelijkheden per scenario>.
Selecteer onder de optie Voorbeeld aan de rechterkant persoonlijke of standaardstem.
Selecteer de knop Afspelen om de vertaalde audio te horen. Selecteer het oorspronkelijke videotabblad om de oorspronkelijke audio af te spelen.
De opties voor spraaktypen zijn:
- Standaardstem: De service selecteert automatisch de meest geschikte standaardstem door de stem van de spreker in de video te vergelijken met standaardstemmen.
- Persoonlijke stem: gebruik de persoonlijke stem die overeenkomt met de stem van de sprekers in de video.
Notitie
Als u persoonlijke stem wilt gebruiken via de API, moet u toegang aanvragen.
Een videovertalingsproject maken
Voer de volgende stappen uit om een videovertalingsproject te maken:
Ga naar de modelcatalogus in azure AI Foundry Portal.
Typ en zoek naar 'Azure-AI-Speech' in het zoekvak van de catalogus.
Selecteer Azure-AI-Speech en u gaat naar de pagina met uitproberen van Azure-AI-Speech .
Selecteer spraakmogelijkheden per scenario>.
Selecteer Ga naar Speech playground.
Selecteer Mijn video's uploaden>.
Selecteer een spraaktype op de pagina Video uploaden.
De opties voor spraaktypen zijn:
- Standaardstem: De service selecteert automatisch de meest geschikte standaardstem door de stem van de spreker in de video te vergelijken met standaardstemmen.
- Persoonlijke stem: gebruik de persoonlijke stem die overeenkomt met de stem van de sprekers in de video.
Notitie
Als u persoonlijke stem wilt gebruiken, moet u toegang aanvragen.
Upload uw videobestand door het videobestand te slepen en neer te trekken of het bestand handmatig te selecteren. De video moet een .mp4-indeling hebben, kleiner dan 5 GB en korter dan 4 uur.
Geef het aantal sprekers, de taal van de video en vertalen naar taal op.
Schakel de selectievakjes in om de prijsinformatie en gedragscode te bevestigen.
Selecteer Volgende: Geavanceerde instellingen als u de geavanceerde instellingen wilt aanpassen.
U kunt desgewenst de volgende instellingen aanpassen:
- Lexicon-bestand: met deze optie kunt u aangepaste woorden of woordgroepen toevoegen die het systeem correct moet herkennen en uitspreken. U kunt een lexicon-bestand maken in het hulpprogramma voor het maken van audio-inhoud in Speech Studio en dit hier selecteren.
- Ondertitels branden: met deze optie kunt u ondertitels toevoegen aan de video. Het subtitelbestand kan de indeling WebVTT of JSON hebben. U kunt een voorbeeld van een WebVTT-bestand voor uw referentie downloaden door het VTT-voorbeeldbestand downloaden te selecteren.
Als u uw eigen ondertitelingsbestanden wilt gebruiken, selecteert u Ondertitel>uploaden uw eigen. U kunt ervoor kiezen om het bronondertitelbestand of het doelondertitelbestand te uploaden.
- Automatische ondertitels: resultaten in ondertitels voor zowel de bron- als de doeltaal.
- Ondertitels van de brontaal uploaden: resulteert in ondertitels voor zowel de bron- als de doeltaal.
- Ondertitels van doeltaal uploaden: resulteert in alleen doeltaalondertitels.
Klik op Creëren.
Zodra het uploaden naar Azure Blob Storage is voltooid, kunt u de verwerkingsstatus controleren op het tabblad Project.
Nadat het project is gemaakt, kunt u het project selecteren om gedetailleerde instellingen te bekijken en aanpassingen aan te brengen op basis van uw voorkeuren.
Spraakinstellingen controleren en aanpassen
Selecteer Mijn video's en u ziet nu een video met de status Geslaagd .
Selecteer de video om de tabbladen Vertaald en Origineel onder Video weer te geven. U kunt de oorspronkelijke en vertaalde video's vergelijken door het bijbehorende tabblad te selecteren. De vertaalde video wordt automatisch gegenereerd en u kunt deze afspelen om de kwaliteit van de vertaling te controleren.
Aan de rechterkant van de video kunt u zowel het oorspronkelijke script als het vertaalde script bekijken. Als u elk deel van het oorspronkelijke script aanwijst, wordt de video geactiveerd om automatisch naar het bijbehorende segment van de oorspronkelijke video te gaan, terwijl u de muisaanwijzer boven elk deel van het vertaalde script plaatst, wordt de video geactiveerd om naar het bijbehorende vertaalde segment te gaan.
U kunt meerdere wijzigingen aanbrengen in de video, zoals het aanpassen van de spraakinstellingen, het toevoegen of verwijderen van segmenten en het wijzigen van het tijdsbestek van de scripts. Er worden alleen kosten in rekening gebracht nadat u Wijzigingen toepassen hebt geselecteerd om uw wijzigingen toe te passen. U kunt Opslaan selecteren om werk in uitvoering op te slaan zonder dat er kosten in rekening worden gebracht.
Als u segmenten met een 'niet-geïdentificeerde' stemnaam tegenkomt, kan het zijn dat het systeem de stem niet nauwkeurig kan detecteren, met name in situaties waarin sprekerstemmen elkaar overlappen. In dergelijke gevallen is het raadzaam om de naam van de stem handmatig te wijzigen.
Vertalen naar een andere taal
U kunt het huidige vertaalproject behouden en de oorspronkelijke video vertalen naar een andere taal.
- Selecteer Mijn video's en selecteer vervolgens de tegel voor uw videoomzetting.
- Selecteer + Nieuwe taal.
- Kies op de nieuwe pagina Vertalen naar een nieuwe taal die wordt weergegeven een nieuwe vertaaltaal en spraaktype. Zodra de video is vertaald, wordt automatisch een nieuw project gemaakt.
Gerelateerde inhoud
In dit artikel leert u hoe u videoomzetting gebruikt met Azure AI Speech in Speech Studio.
Voorwaarden
- Een Azure-abonnement. Als u nog geen abonnement op Azure hebt, maak dan een gratis account aan voordat u begint.
- Een spraakresource in een ondersteunde regio. Als u geen Spraak-resource hebt, maakt u er een in Azure Portal.
- Een Azure Blob Storage--account.
- U hebt een videobestand nodig in .mp4 indeling, kleiner dan 5 GB en korter dan 4 uur. Voor testdoeleinden kunt u het voorbeeldvideobestand van Microsoft gebruiken op https://ai.azure.com/speechassetscache/ttsvoice/VideoTranslation/PublicDoc/SampleData/es-ES-TryOutOriginal.mp4.
- Zorg ervoor dat videovertaling uw bron- en doeltaal ondersteunt.
Een videovertalingsproject maken
Voer de volgende stappen uit om een videovertalingsproject te maken:
Meld u aan bij Speech Studio.
Selecteer het abonnement en de Spraak-resource waarmee u wilt werken.
Selecteer Videovertaling.
Op de pagina Projecten maken en beheren, selecteer Een project maken.
Selecteer een spraaktype op de pagina Nieuw project.
De opties voor spraaktypen zijn:
- Standaardstem: De service selecteert automatisch de meest geschikte standaardstem door de stem van de spreker in de video te vergelijken met standaardstemmen.
- Persoonlijke stem: gebruik de persoonlijke stem die overeenkomt met de stem van de sprekers in de video.
Notitie
Als u persoonlijke stem wilt gebruiken, moet u toegang aanvragen.
Upload uw videobestand door het videobestand te slepen en neer te trekken of het bestand handmatig te selecteren. De video moet een .mp4-indeling hebben, kleiner dan 5 GB en korter dan 4 uur.
Geef de projectnaam, het aantal sprekers, de taal van de video en vertalen naar de taal op.
Schakel de selectievakjes in om de prijsinformatie en gedragscode te bevestigen.
Selecteer Volgende: Geavanceerde instellingen als u de geavanceerde instellingen wilt aanpassen.
U kunt desgewenst de volgende instellingen aanpassen:
- Lexicon-bestand: met deze optie kunt u aangepaste woorden of woordgroepen toevoegen die het systeem correct moet herkennen en uitspreken. U kunt een lexicon-bestand maken in het hulpprogramma voor het maken van audio-inhoud in Speech Studio en dit hier selecteren.
- Ondertitels branden: met deze optie kunt u ondertitels toevoegen aan de video. Het subtitelbestand kan de indeling WebVTT of JSON hebben. U kunt een voorbeeld van een WebVTT-bestand voor uw referentie downloaden door het VTT-voorbeeldbestand downloaden te selecteren.
Als u uw eigen ondertitelingsbestanden wilt gebruiken, selecteert u Ondertitel>uploaden uw eigen. U kunt ervoor kiezen om het bronondertitelbestand of het doelondertitelbestand te uploaden.
- Automatische ondertitels: resultaten in ondertitels voor zowel de bron- als de doeltaal.
- Ondertitels van de brontaal uploaden: resulteert in ondertitels voor zowel de bron- als de doeltaal.
- Ondertitels van doeltaal uploaden: resulteert in alleen doeltaalondertitels.
Klik op Creëren.
Zodra het uploaden naar Azure Blob Storage is voltooid, kunt u de verwerkingsstatus controleren op het tabblad Project.
Nadat het project is gemaakt, kunt u het project selecteren om gedetailleerde instellingen te bekijken en aanpassingen aan te brengen op basis van uw voorkeuren.
Spraakinstellingen controleren en aanpassen
Op de pagina projectdetails ziet u de tabbladen Vertaald en Origineel onder Video. U kunt de oorspronkelijke en vertaalde video's vergelijken door het bijbehorende tabblad te selecteren. De vertaalde video wordt automatisch gegenereerd en u kunt deze afspelen om de kwaliteit van de vertaling te controleren.
Aan de rechterkant van de video kunt u zowel het oorspronkelijke script als het vertaalde script bekijken. Als u elk deel van het oorspronkelijke script aanwijst, wordt de video geactiveerd om automatisch naar het bijbehorende segment van de oorspronkelijke video te gaan, terwijl u de muisaanwijzer boven elk deel van het vertaalde script plaatst, wordt de video geactiveerd om naar het bijbehorende vertaalde segment te gaan.
U kunt indien nodig ook segmenten toevoegen of verwijderen. Wanneer u een segment wilt toevoegen, moet u ervoor zorgen dat de tijdstempel van het nieuwe segment niet overlapt met het vorige en volgende segment en dat de eindtijd van het segment groter moet zijn dan de begintijd. De juiste notatie van de tijdstempel moet zijn hh:mm:ss.ms
. Anders kunt u de wijzigingen niet toepassen.
U kunt het tijdsbestek van de scripts rechtstreeks aanpassen met behulp van de audiogolfvorm onder de video. De aanpassingen worden toegepast nadat u Wijzigingen toepassen hebt geselecteerd.
Als u segmenten met een 'niet-geïdentificeerde' stemnaam tegenkomt, kan het zijn dat het systeem de stem niet nauwkeurig kan detecteren, met name in situaties waarin sprekerstemmen elkaar overlappen. In dergelijke gevallen is het raadzaam om de naam van de stem handmatig te wijzigen.
Als u de stem wilt aanpassen, selecteert u Spraakinstellingen om enkele wijzigingen aan te brengen. Op de pagina Spraakinstellingen kunt u het spraaktype, geslacht en de stem aanpassen. Selecteer het spraakvoorbeeld rechts van Voice om uw stemselectie te bepalen. Als er sprake is van ontbrekende stem, kunt u de naam van de nieuwe stem toevoegen door spreker toevoegen te selecteren. Nadat u de instellingen hebt gewijzigd, selecteert u Bijwerken.
U kunt meerdere wijzigingen aanbrengen in de video, zoals het aanpassen van de spraakinstellingen, het toevoegen of verwijderen van segmenten en het wijzigen van het tijdsbestek van de scripts. Er worden alleen kosten in rekening gebracht nadat u Wijzigingen toepassen hebt geselecteerd om uw wijzigingen toe te passen. U kunt Opslaan selecteren om werk in uitvoering op te slaan zonder dat er kosten in rekening worden gebracht.
Vertalen naar een andere taal
U kunt het huidige vertaalproject behouden en de oorspronkelijke video vertalen naar een andere taal.
- Open uw project.
- Selecteer + Nieuwe taal.
- Kies op de nieuwe pagina Vertalen die wordt weergegeven een nieuwe vertaalde taal en spraaktype. Zodra de video is vertaald, wordt automatisch een nieuw project gemaakt.
Gerelateerde inhoud
De REST API voor videovertaling vereenvoudigt naadloze integratie van videovertalingen in uw toepassingen. Het biedt ondersteuning voor het uploaden, beheren en verfijnen van videovertalingen, met meerdere iteraties voor continue verbetering. In dit artikel leert u hoe u videoomzetting kunt gebruiken via de REST API.
Voorwaarden
- Een Azure-abonnement. Als u nog geen abonnement op Azure hebt, maak dan een gratis account aan voordat u begint.
- een AI Foundry-resource voor Spraak in een ondersteunde regio. Als u geen Spraak-resource hebt, maakt u er een in Azure Portal.
- Een Azure Blob Storage--account.
- U hebt een videobestand nodig in .mp4 indeling, kleiner dan 5 GB en korter dan 4 uur. Voor testdoeleinden kunt u het voorbeeldvideobestand van Microsoft gebruiken op https://ai.azure.com/speechassetscache/ttsvoice/VideoTranslation/PublicDoc/SampleData/es-ES-TryOutOriginal.mp4.
- Zorg ervoor dat videovertaling uw bron- en doeltaal ondersteunt.
Hint
Voordat u begint, raadpleegt u het overzicht van videovertaling om inzicht te hebben in het end-to-end proces van videovertaling.
Werkproces
Hier volgen de stappen voor het ophalen van een vertaalde video met behulp van de REST API:
-
Maak een vertaalobject. Controleer regelmatig de status van de bewerking totdat deze is bereikt
Succeeded
ofFailed
. -
Maak een iteratie om het vertaalproces te starten. Controleer regelmatig de status van de iteratiebewerking totdat deze is bereikt
Succeeded
ofFailed
. - Download de vertaalde video en ondertitels.
- U kunt eventueel extra iteraties maken om de kwaliteit van de vertaling te verbeteren.
Stap 1: Een vertaling maken
Belangrijk
Als u een vertaling maakt zoals beschreven in deze sectie, wordt het vertaalproces niet gestart. U kunt beginnen met het vertalen van de video door een iteratie te maken. Vertalingen en iteraties die zijn gemaakt via de REST API, worden niet gesynchroniseerd met de portal en omgekeerd.
Als u een videoomzetting wilt maken, moet u een HTTP PUT-aanvraagpad en hoofdtekst maken volgens de volgende instructies:
Geef
displayName
op: de weergavenaam van de vertaling. Dit is een gebruiksvriendelijke naam waarmee u de vertaling kunt identificeren.Geef
description
op: Een korte beschrijving van de vertaling. Dit is optioneel, maar kan nuttig zijn voor documentatiedoeleinden.Geef het
sourceLocale
volgende op: De taal van de oorspronkelijke video. Dit is de taal die in het videobestand wordt gesproken.Geef het
targetLocale
volgende op: de taal waarin u de video wilt vertalen. Dit is de doeltaal voor de vertaling.Geef
voiceKind
het type stem op dat u wilt gebruiken voor de vertaling. U kunt kiezen tussenPlatformVoice
enPersonalVoice
. HiervoorPlatformVoice
selecteert het systeem automatisch de meest geschikte standaardstem door de stem van de spreker in de video te vergelijken met standaardstemmen. HiervoorPersonalVoice
biedt het systeem een model dat binnen een paar seconden spraakreplicatie van hoge kwaliteit genereert.Notitie
Als u persoonlijke stem wilt gebruiken, moet u toegang aanvragen.
Geef
speakerCount
op: het aantal sprekers in de video. Dit is een optionele parameter en u kunt deze instellen op 1 als u niet zeker weet.Geef
subtitleMaxCharCountPerSegment
op: het maximum aantal tekens dat per subtitelsegment is toegestaan. Dit is een optionele parameter en u kunt deze instellen op 30 als u niet zeker weet.Geef
exportSubtitleInVideo
op: Een Booleaanse waarde die aangeeft of ondertitels in de video moeten worden geëxporteerd. Dit is een optionele parameter en u kunt dezetrue
instellen op als u ondertitels wilt opnemen in de video.Geef het
videoFileUrl
volgende op: de URL van het videobestand dat u wilt vertalen. De video moet een .mp4-indeling hebben, kleiner dan 5 GB en korter dan 4 uur. U kunt de video uploaden naar Azure Blob Storage en de Blob-URL gebruiken. Voor testdoeleinden kunt u het voorbeeldvideobestand van Microsoft gebruiken op https://ai.azure.com/speechassetscache/ttsvoice/VideoTranslation/PublicDoc/SampleData/es-ES-TryOutOriginal.mp4.
Voor verificatie en autorisatie moet u de volgende headers en pad-ID's opnemen in uw aanvraag.
- Stel de
Operation-Id
header in: deOperation-Id
moet uniek zijn voor elke bewerking, zoals het maken van elke iteratie. VervangYour-Operation-Id
door een unieke id voor deze bewerking. - Vervang
Your-Translation-Id
in het pad. De vertalings-id moet uniek zijn voor alle vertalingen voor de Spraak-resource. Vervang doorYour-Translation-Id
een vertaal-id van uw keuze. U gebruikt deze id om te verwijzen naar de vertaling in volgende API-aanroepen. - Vervang
YourSpeechResourceKey
door uw spraaksleutel en vervangYourSpeechResourceRegion
door uw spraakregio.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" -H "Operation-Id: Your-Operation-Id-1" -H "Content-Type: application/json" -d '{
"displayName": "My translation object",
"description": "My translation object for video translation iterations",
"input": {
"sourceLocale": "es-ES",
"targetLocale": "en-US",
"voiceKind": "PlatformVoice",
"speakerCount": 1,
"subtitleMaxCharCountPerSegment": 50,
"exportSubtitleInVideo": false,
"enableLipSync": false,
"videoFileUrl": "https://ai.azure.com/speechassetscache/ttsvoice/VideoTranslation/PublicDoc/SampleData/es-ES-TryOutOriginal.mp4"
}
}' "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/translations/Your-Translation-Id?api-version=2024-05-20"
Belangrijk
Als u een bestaande vertaal-id met verschillende instellingen probeert te gebruiken, retourneert de API een fout. De vertaal-id moet uniek zijn voor elke vertaling. U kunt wijzigingen aanbrengen in een bestaande vertaling door een iteratie te maken.
U ontvangt een antwoordtekst in de volgende indeling:
{
"input": {
"sourceLocale": "es-ES",
"targetLocale": "en-US",
"voiceKind": "PlatformVoice",
"speakerCount": 1,
"subtitleMaxCharCountPerSegment": 50,
"exportSubtitleInVideo": false,
"enableLipSync": false
},
"status": "NotStarted",
"lastActionDateTime": "2025-03-06T19:13:35.669Z",
"id": "Your-Translation-Id",
"displayName": "My translation object",
"description": "My translation object for video translation iterations",
"createdDateTime": "2025-03-06T19:13:35.669Z"
}
U kunt de bewerkings-id die u hebt opgegeven gebruiken en de API 'Get-bewerking op basis van bewerkings-id' periodiek uitvoeren totdat de geretourneerde status Succeeded
of Failed
is. Met deze bewerking kunt u de voortgang van het maken van het iteratieproces controleren. De statuseigenschap moet worden voortgezet van NotStarted
tot Running
, en ten slotte naar Succeeded
of Failed
.
Stap 2: een iteratie maken
Als u uw video wilt vertalen of een iteratie wilt bijwerken voor een bestaande vertaling, moet u een HTTP PUT-aanvraagpad en hoofdtekst maken volgens de volgende instructies:
- Stel de vereiste invoer in: Geef details op, zoals
speakerCount
,subtitleMaxCharCountPerSegment
ofexportSubtitleInVideo
webvttFile
. Standaard worden er geen ondertitels ingesloten in de uitvoervideo. Als u tijdens het maken van een iteratie al de optionele parametersspeakerCount
subtitleMaxCharCountPerSegment
hebt opgegeven enexportSubtitleInVideo
tijdens het maken van de vertaling, hoeft u deze niet opnieuw op te geven. De waarden worden overgenomen uit de vertaalinstellingen. Zodra deze parameters zijn gedefinieerd bij het maken van een iteratie, overschrijven de nieuwe waarden de oorspronkelijke instellingen. - U kunt desgewenst een WebVTT-bestand met ondertitels voor uw oorspronkelijke video opgeven. De
webvttFile
invoerparameter is niet vereist bij het maken van de eerste iteratie. Vanaf de tweede iteratie moet u echter dewebvttFile
parameter opgeven in het iteratieproces.
Voor verificatie en autorisatie moet u de volgende headers en pad-ID's opnemen in uw aanvraag.
- Stel de
Operation-Id
header in: deOperation-Id
moet uniek zijn voor elke bewerking, zoals het maken van elke iteratie. VervangYour-Operation-Id
door een unieke id voor deze bewerking. - Vervang
Your-Translation-Id
in het pad. Gebruik dezelfde vertaal-id die u hebt opgegeven toen u de vertaling maakte. De vertalings-id blijft ongewijzigd. - Geef een nieuw
iterationId
in het pad op. De iteratie-id moet uniek zijn voor elke bewerking. Vervang doorYour-Iteration-Id-1
een iteratie-id van uw keuze. - Vervang
YourSpeechResourceKey
door uw spraaksleutel en vervangYourSpeechResourceRegion
door uw spraakregio.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" \
-H "Operation-Id: Your-Operation-Id" \
-H "Content-Type: application/json" \
-d '{
"input": {
"subtitleMaxCharCountPerSegment": 30,
"exportSubtitleInVideo": true
}
}' "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/translations/Your-Translation-Id/iterations/Your-Iteration-Id-1?api-version=2024-05-20"
U ontvangt een antwoordtekst in de volgende indeling:
{
"input": {
"subtitleMaxCharCountPerSegment": 30,
"exportSubtitleInVideo": true
},
"status": "NotStarted",
"lastActionDateTime": "2025-03-06T19:15:38.722Z",
"id": "Your-Iteration-Id",
"createdDateTime": "2025-03-06T19:15:38.722Z"
}
U kunt de bewerkings-id die u hebt opgegeven gebruiken en de API 'Get-bewerking op basis van bewerkings-id' periodiek uitvoeren totdat de geretourneerde status Succeeded
of Failed
is. Met deze bewerking kunt u de voortgang van het maken van het iteratieproces controleren. De statuseigenschap moet worden voortgezet van NotStarted
tot Running
, en ten slotte naar Succeeded
of Failed
.
Stap 3: De vertaalde video en ondertitels downloaden
U kunt de vertaalde video en ondertitels downloaden zodra de iteratiestatus is Succeeded
. De vertaalde video en ondertitels zijn beschikbaar in de body van de respons van de API voor ophalen van een iteratie via iteratie-ID.
Gebruik de HTTP GET-aanvraag om details van een specifieke iteratie op te halen op basis van de bijbehorende id. Vervang YourSpeechResourceKey
door uw Spraak-resourcesleutel, YourSpeechResourceRegion
door uw Spraak-resourceregio, Your-Translation-Id
door de vertaal-id die u wilt controleren en Your-Iteration-Id
door de iteratie-id die u wilt controleren.
curl -v -X GET -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/translations/Your-Translation-Id/iterations/Your-Iteration-Id?api-version=2024-05-20"
U ontvangt een antwoordtekst in de volgende indeling:
{
"input": {
"speakerCount": 1,
"subtitleMaxCharCountPerSegment": 30,
"exportSubtitleInVideo": true
},
"result": {
"translatedVideoFileUrl": "https://cvoiceprodeus.blob.core.windows.net/YourTranslatedVideoFileUrl",
"sourceLocaleSubtitleWebvttFileUrl": "https://cvoiceprodeus.blob.core.windows.net/YourSourceLocaleSubtitleWebvttFileUrl",
"targetLocaleSubtitleWebvttFileUrl": "https://cvoiceprodeus.blob.core.windows.net/YourTargetLocaleSubtitleWebvttFileUrl",
"metadataJsonWebvttFileUrl": "https://cvoiceprodeus.blob.core.windows.net/YourMetadataJsonWebvttFileUrl",
},
"status": "Succeeded",
"lastActionDateTime": "2025-03-06T19:17:06.270Z",
"id": "Your-Iteration-Id-7",
"createdDateTime": "2025-03-06T19:15:38.723Z"
}
Downloaden van de resultaat-URL's
De hoofdtekst van het antwoord bevat de volgende URL's voor het downloaden van de vertaalde video en ondertitels:
-
translatedVideoFileUrl
: De URL van het vertaalde videobestand. U kunt de vertaalde video downloaden via deze URL. -
sourceLocaleSubtitleWebvttFileUrl
: De URL van het WebVTT-bestand voor de bronlocatie. U kunt het WebVTT-bestand downloaden via deze URL. -
targetLocaleSubtitleWebvttFileUrl
: De URL van het WebVTT-bestand voor de doellocatie. U kunt het WebVTT-bestand downloaden via deze URL. -
metadataJsonWebvttFileUrl
: De URL van het JSON WebVTT-bestand met metagegevens. U kunt het JSON WebVTT-bestand met metagegevens downloaden van deze URL.
Hier volgen voorbeelden van de indelingen voor de subtitelbestanden:
sourceLocaleSubtitleWebvttFileUrl
WEBVTT
00:00:00.320 --> 00:00:03.880
Microsoft ha estado 25 años comprometido con El Salvador.
00:00:03.960 --> 00:00:08.440
Microsoft es hablar de innovación y es hablar del presente y futuro del Salvador.
00:00:09.080 --> 00:00:15.840
Son 25 años y contando los que como marca Microsoft ha logrado cumplir con cada 1 de sus objetivos en El País.
00:00:16.040 --> 00:00:23.400
Nos apoyamos muchísimo en su liderazgo, en su tecnología de punta y en su innovación continua.
00:00:23.800 --> 00:00:29.760
Microsoft le permite a Nico ser parte de un ecosistema tecnológico a nivel mundial más que un aliado para nosotros,
00:00:29.760 --> 00:00:33.880
más que un socio, realmente es un amigo, un amigo estratégico,
00:00:34.840 --> 00:00:39.800
incondicional, teniendo en cuenta y como principal razón de ser nuestra misión y visión,
00:00:40.080 --> 00:00:45.400
permitiendo que los salvadoreños puedan percatarse de su potencial. 25 años de experiencia.
00:00:45.680 --> 00:00:50.480
25 años impulsando, innovando y mejorando en cada una de nuestras facetas.
00:00:50.880 --> 00:00:58.080
Nuestra misión sigue intacta, empoderar a todas las personas y organizaciones del planeta a lograr más felices.
00:00:58.080 --> 00:01:01.240
25, Microsoft felices. 25, El Salvador.
00:01:01.480 --> 00:01:05.920
Juntos seguiremos innovando y progresando un mejor bienestar con tecnología.
WebVTT met JSON-eigenschappen
Het WebVTT-bestand met JSON-eigenschappen bevat metagegevens over het vertaalproces. Elk subtitelsegment bevat eigenschappen die aanvullende informatie over de vertaling bieden. Hier volgt een uitsplitsing van de eigenschappen:
-
globalMetadata
: Deze sectie bevat metagegevens over de sprekers in de video. De eigenschap Sprekers is een object dat informatie over elke spreker bevat. Elke spreker wordt geïdentificeerd met een unieke id (bijvoorbeeld 'Speaker0'). De eigenschap defaultSsmlProperties bevat de standaard-SSML-eigenschappen voor de stem van de spreker. -
id
: Dit is een unieke id voor elk subtitelsegment. Het helpt bij het identificeren van het specifieke tekstsegment in het WebVTT-bestand. -
speakerId
: Deze eigenschap geeft de id van de luidspreker voor het bijbehorende subtitelsegment aan. Deze moet overeenkomen met de spreker-id die is gedefinieerd in de sectie globalMetadata. -
ssmlProperties
: Deze sectie bevat eigenschappen met betrekking tot de stem van de spreker. Het kan eigenschappen bevatten, zoals 'voiceName' en 'voiceKind'. De 'voiceName' is de naam van de stem die wordt gebruikt voor synthese en de 'voiceKind' geeft aan of het een platformstem of een persoonlijke stem is. -
sourceLocaleText
: Deze eigenschap bevat de oorspronkelijke tekst in de brontaal. Als u alleen wijzigingen aanbrengt aansourceLocaleText
, zal het systeem de bijgewerktesourceLocaleText
vertalen en de nieuwe vertaling gebruiken voor synthese. Als u wijzigingen aanbrengt in beidesourceLocaleText
entranslatedText
, negeert het systeem de wijzigingen insourceLocaleText
en gebruikt het bijgewerktetranslatedText
voor synthese. -
translatedText
: Deze eigenschap bevat de vertaalde tekst in de doeltaal. Het vertegenwoordigt de tekst die wordt gesynthetiseerd in de vertaalde video. Als u alleen wijzigingen aanbrengt aantranslatedText
, gebruikt het systeem de bijgewerkte vertaalde tekst voor synthese.
Stap 4: Extra iteraties maken (optioneel)
U kunt extra iteraties maken om de kwaliteit van de vertaling te verbeteren. Het proces is vergelijkbaar met het maken van de eerste iteratie.
De webvttFile
parameter is niet vereist bij het maken van de eerste iteratie. Vanaf de tweede iteratie moet u echter de webvttFile
parameter opgeven in het iteratieproces. U moet het webvtt-bestand downloaden, de benodigde wijzigingen aanbrengen en het vervolgens uploaden naar uw Azure Blob-opslag. U moet de Blob-URL opgeven.
Als u uw video wilt vertalen of een iteratie wilt bijwerken voor een bestaande vertaling, moet u een HTTP PUT-aanvraagpad en hoofdtekst maken volgens de volgende instructies:
- Geef de vereiste
webvttFile
invoerparameter op. DewebvttFile
parameter is vereist vanaf de tweede iteratie. U moet het meest recente webvtt-bestand downloaden, de gewenste wijzigingen aanbrengen en vervolgens uploaden naar uw Azure Blob-opslag. U moet de Blob-URL opgeven. Het subtitelbestand kan de indeling WebVTT of JSON hebben. - U kunt desgewenst nieuwe instellingen opgeven voor de nieuwe iteratie, zoals
speakerCount
,subtitleMaxCharCountPerSegment
enexportSubtitleInVideo
.
Voor verificatie en autorisatie moet u de volgende headers en pad-ID's opnemen in uw aanvraag.
- Stel de
Operation-Id
header in: deOperation-Id
moet uniek zijn voor elke bewerking, zoals het maken van elke iteratie. VervangYour-Operation-Id
door een unieke id voor deze bewerking. - Vervang
Your-Translation-Id
in het pad. Gebruik dezelfde vertaal-id die u hebt opgegeven toen u de vertaling maakte. De vertalings-id blijft ongewijzigd. - Geef een nieuw
iterationId
in het pad op. De iteratie-id moet uniek zijn voor elke bewerking. Vervang doorYour-Iteration-Id-2
een iteratie-id van uw keuze. - Vervang
YourSpeechResourceKey
door uw spraaksleutel en vervangYourSpeechResourceRegion
door uw spraakregio.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" \
-H "Operation-Id: Your-Operation-Id" \
-H "Content-Type: application/json" \
-d '{
"input": {
"webvttFile": {
"url": "https://YourBlobStorageUrl/YourWebVTTFile.vtt"
}
}
}' "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/translations/Your-Translation-Id/iterations/Your-Iteration-Id-2?api-version=2024-05-20"
U ontvangt een antwoordtekst in de volgende indeling:
{
"input": {
"webvttFile": {
"url": "https://YourBlobStorageUrl/YourWebVTTFile.vtt"
}
},
"status": "NotStarted",
"lastActionDateTime": "2025-03-06T19:15:38.722Z",
"id": "Your-Iteration-Id-2",
"createdDateTime": "2025-03-06T19:15:38.722Z"
}
U kunt de bewerkings-id die u hebt opgegeven gebruiken en de API 'Get-bewerking op basis van bewerkings-id' periodiek uitvoeren totdat de geretourneerde status Succeeded
of Failed
is. Met deze bewerking kunt u de voortgang van het maken van het iteratieproces controleren. De statuseigenschap moet worden voortgezet van NotStarted
tot Running
, en ten slotte naar Succeeded
of Failed
.
Bewerking ophalen met bewerkings-id
Controleer de status van een bewerking met behulp van de bijbehorende bewerkings-id. De bewerkings-id is uniek voor elke bewerking, zodat u elke bewerking afzonderlijk kunt bijhouden. De bewerkings-id is geldig totdat de vertaling is verwijderd.
- Geef hetzelfde
Operation-Id
op dat u hebt gebruikt bij het maken van de vertaling. In het voorbeeldYour-Operation-Id-1
wordt gebruikt. Vervang doorYour-Operation-Id-1
een bewerkings-id van uw keuze. - Vervang
YourSpeechResourceKey
door uw spraaksleutel en vervangYourSpeechResourceRegion
door uw spraakregio.
curl -v -X GET -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/operations/Your-Operation-Id-1?api-version=2024-05-20"
U ontvangt een antwoordtekst in de volgende indeling:
{
"id": "Your-Operation-Id-1",
"status": "Running"
}
Een vertaling verwijderen met vertaal-id
Verwijder een specifieke vertaling die is geïdentificeerd door translationId
. Met deze bewerking worden ook alle iteraties verwijderd die aan deze vertaling zijn gekoppeld.
Vervang YourSpeechResourceKey
door de spraakresourcesleutel, YourSpeechResourceRegion
door uw spraakresourceregio en Your-Translation-Id
door de vertaal-id die u wilt verwijderen. Als deze niet handmatig wordt verwijderd, behoudt de service de vertaalgeschiedenis tot 31 dagen.
curl -v -X DELETE -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/translations/Your-Translation-Id?api-version=2024-05-20"
De antwoordheaders bevatten HTTP/1.1 204 No Content
als de verwijderaanvraag is geslaagd.
REST API-bewerkingen
U kunt de volgende REST API-bewerkingen gebruiken voor videoomzetting:
Operatie | Methode | REST API-aanroep |
---|---|---|
Een vertaling maken | PUT |
/translations/{translationId} |
Vertalingen vermelden | GET |
/translations |
Een vertaling ophalen via vertaal-id | GET |
/translations/{translationId} |
Een iteratie maken | PUT |
/translations/{translationId}/iterations/{iterationId} |
Iteraties weergeven | GET |
/translations/{translationId}/iterations |
Een iteratie ophalen via iteratie-id | GET |
/translations/{translationId}/iterations/{iterationId} |
Bewerking ophalen aan de hand van bewerkings-id | GET |
/operations/{operationId} |
Een vertaling verwijderen met vertaal-ID | DELETE |
/translations/{translationId} |
Zie GitHub voor codevoorbeelden.
Deze sectie bevat voorbeelden voor andere API-aanroepen voor videoomzetting die eerder niet gedetailleerd worden beschreven.
Vertalingen vermelden
Als u alle videovertalingen wilt weergeven die zijn geüpload en verwerkt in uw resourceaccount, maakt u een HTTP GET-aanvraag, zoals wordt weergegeven in het volgende voorbeeld. Vervang YourSpeechResourceKey
door uw spraaksleutel en vervang YourSpeechResourceRegion
door uw spraakregio.
curl -v -X GET -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/translations?api-version=2024-05-20"
Een vertaling ophalen op vertaal-id
Met deze bewerking wordt gedetailleerde informatie opgehaald over een specifieke vertaling, geïdentificeerd door de unieke vertaling translationId
. Vervang YourSpeechResourceKey
door de spraakresourcesleutel, YourSpeechResourceRegion
door uw spraakresourceregio en Your-Translation-Id
door de vertaal-id die u wilt controleren.
curl -v -X GET -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/translations/Your-Translation-Id?api-version=2024-05-20"
Iteraties weergeven
Alle iteraties voor een specifieke vertaling weergeven. Deze aanvraag bevat alle iteraties zonder gedetailleerde informatie. Vervang YourSpeechResourceKey
door de spraakresourcesleutel, YourSpeechResourceRegion
door uw spraakresourceregio en Your-Translation-Id
door de vertaal-id die u wilt controleren.
curl -v -X GET -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/translations/Your-Translation-Id/iterations?api-version=2024-05-20"
HTTP-statuscode
In de sectie worden de HTTP-antwoordcodes en -berichten van de REST API voor videovertaling beschreven.
HTTP 200 OK
HTTP 200 OK geeft aan dat de aanvraag is geslaagd.
HTTP 204 fout
Een HTTP 204-fout geeft aan dat de aanvraag is geslaagd, maar dat de resource niet bestaat. Voorbeeld:
- U hebt geprobeerd een vertaling te verkrijgen of te verwijderen die niet bestaat.
- U hebt een vertaling verwijderd.
HTTP foutmelding 400
Hier volgen voorbeelden die kunnen leiden tot de 400-fout:
- De bron- of doellandinstelling die u hebt opgegeven, valt niet onder de ondersteunde landinstellingen.
- U hebt geprobeerd een F0 Speech-resource te gebruiken, maar de regio ondersteunt alleen de prijscategorie Standard Speech-resources.
HTTP 500-fout
HTTP 500 Interne serverfout geeft aan dat de aanvraag is mislukt. De hoofdtekst van het antwoord bevat het foutbericht.