Delen via


Videovertaling gebruiken

Notitie

Deze functie is momenteel beschikbaar als openbare preview-versie. Deze preview wordt aangeboden zonder een service level agreement en we raden deze niet aan voor productieworkloads. Misschien worden bepaalde functies niet ondersteund of zijn de mogelijkheden ervan beperkt. Zie Aanvullende gebruiksvoorwaarden voor Microsoft Azure-previews voor meer informatie.

In dit artikel leert u hoe u videoomzetting gebruikt met Azure AI Speech in de Azure AI Foundry-portal.

Hint

Probeer videovertaling uit in de Azure AI Foundry-portal voordat u de API gebruikt. Gebruik de REST API voor videoomzetting om videoomzetting in uw toepassingen te integreren. Zie REST API voor videovertaling voor meer informatie over de API.

Vereiste voorwaarden

Videovertaling uitproberen

Volg deze stappen om de demo van de videoomzetting uit te proberen:

  1. Ga naar de modelcatalogus in azure AI Foundry Portal.

  2. Typ en zoek naar 'Azure-AI-Speech' in het zoekvak van de catalogus.

    Schermopname van de modelcatalogus in azure AI Foundry Portal.

  3. Selecteer Azure-AI-Speech en u gaat naar de pagina met uitproberen van Azure-AI-Speech .

  4. Selecteer spraakmogelijkheden per scenario>.

    Schermopname van het filteren van de mogelijkheden van de Speech-service per scenario.

  5. Selecteer onder de optie Voorbeeld aan de rechterkant persoonlijke of standaardstem.

  6. Selecteer de knop Afspelen om de vertaalde audio te horen. Selecteer het oorspronkelijke videotabblad om de oorspronkelijke audio af te spelen.

    Schermopname van het selecteren van een spraaktype op de nieuwe projectpagina.

    De opties voor spraaktypen zijn:

    • Standaardstem: De service selecteert automatisch de meest geschikte standaardstem door de stem van de spreker in de video te vergelijken met standaardstemmen.
    • Persoonlijke stem: gebruik de persoonlijke stem die overeenkomt met de stem van de sprekers in de video.

    Notitie

    Als u persoonlijke stem wilt gebruiken via de API, moet u toegang aanvragen.

Een videovertalingsproject maken

Voer de volgende stappen uit om een videovertalingsproject te maken:

  1. Ga naar de modelcatalogus in azure AI Foundry Portal.

  2. Typ en zoek naar 'Azure-AI-Speech' in het zoekvak van de catalogus.

    Schermopname van de modelcatalogus in azure AI Foundry Portal.

  3. Selecteer Azure-AI-Speech en u gaat naar de pagina met uitproberen van Azure-AI-Speech .

  4. Selecteer spraakmogelijkheden per scenario>.

    Schermopname van het filteren van de mogelijkheden van de Speech-service per scenario.

  5. Selecteer Ga naar Speech playground.

  6. Selecteer Mijn video's uploaden>.

    Schermopname van het selecteren van de knop Video uploaden.

  7. Selecteer een spraaktype op de pagina Video uploaden.

    Schermopname van het selecteren van een spraaktype op de nieuwe projectpagina.

    De opties voor spraaktypen zijn:

    • Standaardstem: De service selecteert automatisch de meest geschikte standaardstem door de stem van de spreker in de video te vergelijken met standaardstemmen.
    • Persoonlijke stem: gebruik de persoonlijke stem die overeenkomt met de stem van de sprekers in de video.

    Notitie

    Als u persoonlijke stem wilt gebruiken, moet u toegang aanvragen.

  8. Upload uw videobestand door het videobestand te slepen en neer te trekken of het bestand handmatig te selecteren. De video moet een .mp4-indeling hebben, kleiner dan 5 GB en korter dan 4 uur.

  9. Geef het aantal sprekers, de taal van de video en vertalen naar taal op.

  10. Schakel de selectievakjes in om de prijsinformatie en gedragscode te bevestigen.

  11. Selecteer Volgende: Geavanceerde instellingen als u de geavanceerde instellingen wilt aanpassen.

    Schermopname van het verstrekken van videogegevens op de nieuwe projectpagina.

  12. U kunt desgewenst de volgende instellingen aanpassen:

    • Lexicon-bestand: met deze optie kunt u aangepaste woorden of woordgroepen toevoegen die het systeem correct moet herkennen en uitspreken. U kunt een lexicon-bestand maken in het hulpprogramma voor het maken van audio-inhoud in Speech Studio en dit hier selecteren.
    • Ondertitels branden: met deze optie kunt u ondertitels toevoegen aan de video. Het subtitelbestand kan de indeling WebVTT of JSON hebben. U kunt een voorbeeld van een WebVTT-bestand voor uw referentie downloaden door het VTT-voorbeeldbestand downloaden te selecteren.

    Schermopname van het verstrekken van lexicon- en subtitelinformatie tijdens het maken van een nieuw project.

    Als u uw eigen ondertitelingsbestanden wilt gebruiken, selecteert u Ondertitel>uploaden uw eigen. U kunt ervoor kiezen om het bronondertitelbestand of het doelondertitelbestand te uploaden.

    • Automatische ondertitels: resultaten in ondertitels voor zowel de bron- als de doeltaal.
    • Ondertitels van de brontaal uploaden: resulteert in ondertitels voor zowel de bron- als de doeltaal.
    • Ondertitels van doeltaal uploaden: resulteert in alleen doeltaalondertitels.
  13. Klik op Creëren.

Zodra het uploaden naar Azure Blob Storage is voltooid, kunt u de verwerkingsstatus controleren op het tabblad Project.

Nadat het project is gemaakt, kunt u het project selecteren om gedetailleerde instellingen te bekijken en aanpassingen aan te brengen op basis van uw voorkeuren.

Spraakinstellingen controleren en aanpassen

Selecteer Mijn video's en u ziet nu een video met de status Geslaagd .

Schermopname van het selecteren van een vertaalde video.

Selecteer de video om de tabbladen Vertaald en Origineel onder Video weer te geven. U kunt de oorspronkelijke en vertaalde video's vergelijken door het bijbehorende tabblad te selecteren. De vertaalde video wordt automatisch gegenereerd en u kunt deze afspelen om de kwaliteit van de vertaling te controleren.

Schermopname van het bekijken van details van de vertaalde video.

Aan de rechterkant van de video kunt u zowel het oorspronkelijke script als het vertaalde script bekijken. Als u elk deel van het oorspronkelijke script aanwijst, wordt de video geactiveerd om automatisch naar het bijbehorende segment van de oorspronkelijke video te gaan, terwijl u de muisaanwijzer boven elk deel van het vertaalde script plaatst, wordt de video geactiveerd om naar het bijbehorende vertaalde segment te gaan.

U kunt meerdere wijzigingen aanbrengen in de video, zoals het aanpassen van de spraakinstellingen, het toevoegen of verwijderen van segmenten en het wijzigen van het tijdsbestek van de scripts. Er worden alleen kosten in rekening gebracht nadat u Wijzigingen toepassen hebt geselecteerd om uw wijzigingen toe te passen. U kunt Opslaan selecteren om werk in uitvoering op te slaan zonder dat er kosten in rekening worden gebracht.

Als u segmenten met een 'niet-geïdentificeerde' stemnaam tegenkomt, kan het zijn dat het systeem de stem niet nauwkeurig kan detecteren, met name in situaties waarin sprekerstemmen elkaar overlappen. In dergelijke gevallen is het raadzaam om de naam van de stem handmatig te wijzigen.

Schermopname van één segment met niet-geïdentificeerde spraaknaam.

Vertalen naar een andere taal

U kunt het huidige vertaalproject behouden en de oorspronkelijke video vertalen naar een andere taal.

  1. Selecteer Mijn video's en selecteer vervolgens de tegel voor uw videoomzetting.
  2. Selecteer + Nieuwe taal.
  3. Kies op de nieuwe pagina Vertalen naar een nieuwe taal die wordt weergegeven een nieuwe vertaaltaal en spraaktype. Zodra de video is vertaald, wordt automatisch een nieuw project gemaakt.

In dit artikel leert u hoe u videoomzetting gebruikt met Azure AI Speech in Speech Studio.

Voorwaarden

Een videovertalingsproject maken

Voer de volgende stappen uit om een videovertalingsproject te maken:

  1. Meld u aan bij Speech Studio.

  2. Selecteer het abonnement en de Spraak-resource waarmee u wilt werken.

  3. Selecteer Videovertaling.

  4. Op de pagina Projecten maken en beheren, selecteer Een project maken.

  5. Selecteer een spraaktype op de pagina Nieuw project.

    Schermopname van het selecteren van een spraaktype op de nieuwe projectpagina.

    De opties voor spraaktypen zijn:

    • Standaardstem: De service selecteert automatisch de meest geschikte standaardstem door de stem van de spreker in de video te vergelijken met standaardstemmen.
    • Persoonlijke stem: gebruik de persoonlijke stem die overeenkomt met de stem van de sprekers in de video.

    Notitie

    Als u persoonlijke stem wilt gebruiken, moet u toegang aanvragen.

  6. Upload uw videobestand door het videobestand te slepen en neer te trekken of het bestand handmatig te selecteren. De video moet een .mp4-indeling hebben, kleiner dan 5 GB en korter dan 4 uur.

  7. Geef de projectnaam, het aantal sprekers, de taal van de video en vertalen naar de taal op.

  8. Schakel de selectievakjes in om de prijsinformatie en gedragscode te bevestigen.

  9. Selecteer Volgende: Geavanceerde instellingen als u de geavanceerde instellingen wilt aanpassen.

    Schermopname van het verstrekken van videogegevens op de nieuwe projectpagina.

  10. U kunt desgewenst de volgende instellingen aanpassen:

    • Lexicon-bestand: met deze optie kunt u aangepaste woorden of woordgroepen toevoegen die het systeem correct moet herkennen en uitspreken. U kunt een lexicon-bestand maken in het hulpprogramma voor het maken van audio-inhoud in Speech Studio en dit hier selecteren.
    • Ondertitels branden: met deze optie kunt u ondertitels toevoegen aan de video. Het subtitelbestand kan de indeling WebVTT of JSON hebben. U kunt een voorbeeld van een WebVTT-bestand voor uw referentie downloaden door het VTT-voorbeeldbestand downloaden te selecteren.

    Schermopname van het verstrekken van lexicon- en subtitelinformatie tijdens het maken van een nieuw project.

    Als u uw eigen ondertitelingsbestanden wilt gebruiken, selecteert u Ondertitel>uploaden uw eigen. U kunt ervoor kiezen om het bronondertitelbestand of het doelondertitelbestand te uploaden.

    • Automatische ondertitels: resultaten in ondertitels voor zowel de bron- als de doeltaal.
    • Ondertitels van de brontaal uploaden: resulteert in ondertitels voor zowel de bron- als de doeltaal.
    • Ondertitels van doeltaal uploaden: resulteert in alleen doeltaalondertitels.
  11. Klik op Creëren.

Zodra het uploaden naar Azure Blob Storage is voltooid, kunt u de verwerkingsstatus controleren op het tabblad Project.

Nadat het project is gemaakt, kunt u het project selecteren om gedetailleerde instellingen te bekijken en aanpassingen aan te brengen op basis van uw voorkeuren.

Spraakinstellingen controleren en aanpassen

Op de pagina projectdetails ziet u de tabbladen Vertaald en Origineel onder Video. U kunt de oorspronkelijke en vertaalde video's vergelijken door het bijbehorende tabblad te selecteren. De vertaalde video wordt automatisch gegenereerd en u kunt deze afspelen om de kwaliteit van de vertaling te controleren.

Aan de rechterkant van de video kunt u zowel het oorspronkelijke script als het vertaalde script bekijken. Als u elk deel van het oorspronkelijke script aanwijst, wordt de video geactiveerd om automatisch naar het bijbehorende segment van de oorspronkelijke video te gaan, terwijl u de muisaanwijzer boven elk deel van het vertaalde script plaatst, wordt de video geactiveerd om naar het bijbehorende vertaalde segment te gaan.

U kunt indien nodig ook segmenten toevoegen of verwijderen. Wanneer u een segment wilt toevoegen, moet u ervoor zorgen dat de tijdstempel van het nieuwe segment niet overlapt met het vorige en volgende segment en dat de eindtijd van het segment groter moet zijn dan de begintijd. De juiste notatie van de tijdstempel moet zijn hh:mm:ss.ms. Anders kunt u de wijzigingen niet toepassen.

U kunt het tijdsbestek van de scripts rechtstreeks aanpassen met behulp van de audiogolfvorm onder de video. De aanpassingen worden toegepast nadat u Wijzigingen toepassen hebt geselecteerd.

Als u segmenten met een 'niet-geïdentificeerde' stemnaam tegenkomt, kan het zijn dat het systeem de stem niet nauwkeurig kan detecteren, met name in situaties waarin sprekerstemmen elkaar overlappen. In dergelijke gevallen is het raadzaam om de naam van de stem handmatig te wijzigen.

Schermopname van één segment met niet-geïdentificeerde spraaknaam.

Als u de stem wilt aanpassen, selecteert u Spraakinstellingen om enkele wijzigingen aan te brengen. Op de pagina Spraakinstellingen kunt u het spraaktype, geslacht en de stem aanpassen. Selecteer het spraakvoorbeeld rechts van Voice om uw stemselectie te bepalen. Als er sprake is van ontbrekende stem, kunt u de naam van de nieuwe stem toevoegen door spreker toevoegen te selecteren. Nadat u de instellingen hebt gewijzigd, selecteert u Bijwerken.

Schermopname van het aanpassen van spraakinstellingen op de pagina spraakinstellingen.

U kunt meerdere wijzigingen aanbrengen in de video, zoals het aanpassen van de spraakinstellingen, het toevoegen of verwijderen van segmenten en het wijzigen van het tijdsbestek van de scripts. Er worden alleen kosten in rekening gebracht nadat u Wijzigingen toepassen hebt geselecteerd om uw wijzigingen toe te passen. U kunt Opslaan selecteren om werk in uitvoering op te slaan zonder dat er kosten in rekening worden gebracht.

Schermopname van het selecteren van de knop Wijzigingen toepassen nadat u alle wijzigingen hebt aangebracht.

Vertalen naar een andere taal

U kunt het huidige vertaalproject behouden en de oorspronkelijke video vertalen naar een andere taal.

  1. Open uw project.
  2. Selecteer + Nieuwe taal.
  3. Kies op de nieuwe pagina Vertalen die wordt weergegeven een nieuwe vertaalde taal en spraaktype. Zodra de video is vertaald, wordt automatisch een nieuw project gemaakt.

De REST API voor videovertaling vereenvoudigt naadloze integratie van videovertalingen in uw toepassingen. Het biedt ondersteuning voor het uploaden, beheren en verfijnen van videovertalingen, met meerdere iteraties voor continue verbetering. In dit artikel leert u hoe u videoomzetting kunt gebruiken via de REST API.

Voorwaarden

Hint

Voordat u begint, raadpleegt u het overzicht van videovertaling om inzicht te hebben in het end-to-end proces van videovertaling.

Werkproces

Hier volgen de stappen voor het ophalen van een vertaalde video met behulp van de REST API:

  1. Maak een vertaalobject. Controleer regelmatig de status van de bewerking totdat deze is bereikt Succeeded of Failed.
  2. Maak een iteratie om het vertaalproces te starten. Controleer regelmatig de status van de iteratiebewerking totdat deze is bereikt Succeeded of Failed.
  3. Download de vertaalde video en ondertitels.
  4. U kunt eventueel extra iteraties maken om de kwaliteit van de vertaling te verbeteren.

Stap 1: Een vertaling maken

Belangrijk

Als u een vertaling maakt zoals beschreven in deze sectie, wordt het vertaalproces niet gestart. U kunt beginnen met het vertalen van de video door een iteratie te maken. Vertalingen en iteraties die zijn gemaakt via de REST API, worden niet gesynchroniseerd met de portal en omgekeerd.

Als u een videoomzetting wilt maken, moet u een HTTP PUT-aanvraagpad en hoofdtekst maken volgens de volgende instructies:

  • Geef displayNameop: de weergavenaam van de vertaling. Dit is een gebruiksvriendelijke naam waarmee u de vertaling kunt identificeren.

  • Geef descriptionop: Een korte beschrijving van de vertaling. Dit is optioneel, maar kan nuttig zijn voor documentatiedoeleinden.

  • Geef het sourceLocalevolgende op: De taal van de oorspronkelijke video. Dit is de taal die in het videobestand wordt gesproken.

  • Geef het targetLocalevolgende op: de taal waarin u de video wilt vertalen. Dit is de doeltaal voor de vertaling.

  • Geef voiceKindhet type stem op dat u wilt gebruiken voor de vertaling. U kunt kiezen tussen PlatformVoice en PersonalVoice. Hiervoor PlatformVoiceselecteert het systeem automatisch de meest geschikte standaardstem door de stem van de spreker in de video te vergelijken met standaardstemmen. Hiervoor PersonalVoicebiedt het systeem een model dat binnen een paar seconden spraakreplicatie van hoge kwaliteit genereert.

    Notitie

    Als u persoonlijke stem wilt gebruiken, moet u toegang aanvragen.

  • Geef speakerCountop: het aantal sprekers in de video. Dit is een optionele parameter en u kunt deze instellen op 1 als u niet zeker weet.

  • Geef subtitleMaxCharCountPerSegmentop: het maximum aantal tekens dat per subtitelsegment is toegestaan. Dit is een optionele parameter en u kunt deze instellen op 30 als u niet zeker weet.

  • Geef exportSubtitleInVideoop: Een Booleaanse waarde die aangeeft of ondertitels in de video moeten worden geëxporteerd. Dit is een optionele parameter en u kunt deze true instellen op als u ondertitels wilt opnemen in de video.

  • Geef het videoFileUrlvolgende op: de URL van het videobestand dat u wilt vertalen. De video moet een .mp4-indeling hebben, kleiner dan 5 GB en korter dan 4 uur. U kunt de video uploaden naar Azure Blob Storage en de Blob-URL gebruiken. Voor testdoeleinden kunt u het voorbeeldvideobestand van Microsoft gebruiken op https://ai.azure.com/speechassetscache/ttsvoice/VideoTranslation/PublicDoc/SampleData/es-ES-TryOutOriginal.mp4.

Voor verificatie en autorisatie moet u de volgende headers en pad-ID's opnemen in uw aanvraag.

  • Stel de Operation-Id header in: de Operation-Id moet uniek zijn voor elke bewerking, zoals het maken van elke iteratie. Vervang Your-Operation-Id door een unieke id voor deze bewerking.
  • Vervang Your-Translation-Id in het pad. De vertalings-id moet uniek zijn voor alle vertalingen voor de Spraak-resource. Vervang door Your-Translation-Id een vertaal-id van uw keuze. U gebruikt deze id om te verwijzen naar de vertaling in volgende API-aanroepen.
  • Vervang YourSpeechResourceKey door uw spraaksleutel en vervang YourSpeechResourceRegion door uw spraakregio.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" -H "Operation-Id: Your-Operation-Id-1" -H "Content-Type: application/json" -d '{
  "displayName": "My translation object",
  "description": "My translation object for video translation iterations",
  "input": {
    "sourceLocale": "es-ES",
    "targetLocale": "en-US",
    "voiceKind": "PlatformVoice",
    "speakerCount": 1,
    "subtitleMaxCharCountPerSegment": 50,
    "exportSubtitleInVideo": false,
    "enableLipSync": false,
    "videoFileUrl": "https://ai.azure.com/speechassetscache/ttsvoice/VideoTranslation/PublicDoc/SampleData/es-ES-TryOutOriginal.mp4"
  }
}' "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/translations/Your-Translation-Id?api-version=2024-05-20"

Belangrijk

Als u een bestaande vertaal-id met verschillende instellingen probeert te gebruiken, retourneert de API een fout. De vertaal-id moet uniek zijn voor elke vertaling. U kunt wijzigingen aanbrengen in een bestaande vertaling door een iteratie te maken.

U ontvangt een antwoordtekst in de volgende indeling:

{
  "input": {
    "sourceLocale": "es-ES",
    "targetLocale": "en-US",
    "voiceKind": "PlatformVoice",
    "speakerCount": 1,
    "subtitleMaxCharCountPerSegment": 50,
    "exportSubtitleInVideo": false,
    "enableLipSync": false
  },
  "status": "NotStarted",
  "lastActionDateTime": "2025-03-06T19:13:35.669Z",
  "id": "Your-Translation-Id",
  "displayName": "My translation object",
  "description": "My translation object for video translation iterations",
  "createdDateTime": "2025-03-06T19:13:35.669Z"
}

U kunt de bewerkings-id die u hebt opgegeven gebruiken en de API 'Get-bewerking op basis van bewerkings-id' periodiek uitvoeren totdat de geretourneerde status Succeeded of Failed is. Met deze bewerking kunt u de voortgang van het maken van het iteratieproces controleren. De statuseigenschap moet worden voortgezet van NotStarted tot Running, en ten slotte naar Succeeded of Failed.

Stap 2: een iteratie maken

Als u uw video wilt vertalen of een iteratie wilt bijwerken voor een bestaande vertaling, moet u een HTTP PUT-aanvraagpad en hoofdtekst maken volgens de volgende instructies:

  • Stel de vereiste invoer in: Geef details op, zoals speakerCount, subtitleMaxCharCountPerSegmentofexportSubtitleInVideowebvttFile . Standaard worden er geen ondertitels ingesloten in de uitvoervideo. Als u tijdens het maken van een iteratie al de optionele parameters speakerCountsubtitleMaxCharCountPerSegmenthebt opgegeven en exportSubtitleInVideo tijdens het maken van de vertaling, hoeft u deze niet opnieuw op te geven. De waarden worden overgenomen uit de vertaalinstellingen. Zodra deze parameters zijn gedefinieerd bij het maken van een iteratie, overschrijven de nieuwe waarden de oorspronkelijke instellingen.
  • U kunt desgewenst een WebVTT-bestand met ondertitels voor uw oorspronkelijke video opgeven. De webvttFile invoerparameter is niet vereist bij het maken van de eerste iteratie. Vanaf de tweede iteratie moet u echter de webvttFile parameter opgeven in het iteratieproces.

Voor verificatie en autorisatie moet u de volgende headers en pad-ID's opnemen in uw aanvraag.

  • Stel de Operation-Id header in: de Operation-Id moet uniek zijn voor elke bewerking, zoals het maken van elke iteratie. Vervang Your-Operation-Id door een unieke id voor deze bewerking.
  • Vervang Your-Translation-Id in het pad. Gebruik dezelfde vertaal-id die u hebt opgegeven toen u de vertaling maakte. De vertalings-id blijft ongewijzigd.
  • Geef een nieuw iterationId in het pad op. De iteratie-id moet uniek zijn voor elke bewerking. Vervang door Your-Iteration-Id-1 een iteratie-id van uw keuze.
  • Vervang YourSpeechResourceKey door uw spraaksleutel en vervang YourSpeechResourceRegion door uw spraakregio.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" \
-H "Operation-Id: Your-Operation-Id" \
-H "Content-Type: application/json" \
-d '{
  "input": {
    "subtitleMaxCharCountPerSegment": 30,
    "exportSubtitleInVideo": true
  }
}' "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/translations/Your-Translation-Id/iterations/Your-Iteration-Id-1?api-version=2024-05-20"

U ontvangt een antwoordtekst in de volgende indeling:

{
  "input": {
    "subtitleMaxCharCountPerSegment": 30,
    "exportSubtitleInVideo": true
  },
  "status": "NotStarted",
  "lastActionDateTime": "2025-03-06T19:15:38.722Z",
  "id": "Your-Iteration-Id",
  "createdDateTime": "2025-03-06T19:15:38.722Z"
}

U kunt de bewerkings-id die u hebt opgegeven gebruiken en de API 'Get-bewerking op basis van bewerkings-id' periodiek uitvoeren totdat de geretourneerde status Succeeded of Failed is. Met deze bewerking kunt u de voortgang van het maken van het iteratieproces controleren. De statuseigenschap moet worden voortgezet van NotStarted tot Running, en ten slotte naar Succeeded of Failed.

Stap 3: De vertaalde video en ondertitels downloaden

U kunt de vertaalde video en ondertitels downloaden zodra de iteratiestatus is Succeeded. De vertaalde video en ondertitels zijn beschikbaar in de body van de respons van de API voor ophalen van een iteratie via iteratie-ID.

Gebruik de HTTP GET-aanvraag om details van een specifieke iteratie op te halen op basis van de bijbehorende id. Vervang YourSpeechResourceKey door uw Spraak-resourcesleutel, YourSpeechResourceRegion door uw Spraak-resourceregio, Your-Translation-Id door de vertaal-id die u wilt controleren en Your-Iteration-Id door de iteratie-id die u wilt controleren.

curl -v -X GET -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/translations/Your-Translation-Id/iterations/Your-Iteration-Id?api-version=2024-05-20"  

U ontvangt een antwoordtekst in de volgende indeling:

{
  "input": {
    "speakerCount": 1,
    "subtitleMaxCharCountPerSegment": 30,
    "exportSubtitleInVideo": true
  },
  "result": {
    "translatedVideoFileUrl": "https://cvoiceprodeus.blob.core.windows.net/YourTranslatedVideoFileUrl",
    "sourceLocaleSubtitleWebvttFileUrl": "https://cvoiceprodeus.blob.core.windows.net/YourSourceLocaleSubtitleWebvttFileUrl",
    "targetLocaleSubtitleWebvttFileUrl": "https://cvoiceprodeus.blob.core.windows.net/YourTargetLocaleSubtitleWebvttFileUrl",
    "metadataJsonWebvttFileUrl": "https://cvoiceprodeus.blob.core.windows.net/YourMetadataJsonWebvttFileUrl",
  },
  "status": "Succeeded",
  "lastActionDateTime": "2025-03-06T19:17:06.270Z",
  "id": "Your-Iteration-Id-7",
  "createdDateTime": "2025-03-06T19:15:38.723Z"
}

Downloaden van de resultaat-URL's

De hoofdtekst van het antwoord bevat de volgende URL's voor het downloaden van de vertaalde video en ondertitels:

  • translatedVideoFileUrl: De URL van het vertaalde videobestand. U kunt de vertaalde video downloaden via deze URL.
  • sourceLocaleSubtitleWebvttFileUrl: De URL van het WebVTT-bestand voor de bronlocatie. U kunt het WebVTT-bestand downloaden via deze URL.
  • targetLocaleSubtitleWebvttFileUrl: De URL van het WebVTT-bestand voor de doellocatie. U kunt het WebVTT-bestand downloaden via deze URL.
  • metadataJsonWebvttFileUrl: De URL van het JSON WebVTT-bestand met metagegevens. U kunt het JSON WebVTT-bestand met metagegevens downloaden van deze URL.

Hier volgen voorbeelden van de indelingen voor de subtitelbestanden:

sourceLocaleSubtitleWebvttFileUrl

WEBVTT

00:00:00.320 --> 00:00:03.880
Microsoft ha estado 25 años comprometido con El Salvador.

00:00:03.960 --> 00:00:08.440
Microsoft es hablar de innovación y es hablar del presente y futuro del Salvador.

00:00:09.080 --> 00:00:15.840
Son 25 años y contando los que como marca Microsoft ha logrado cumplir con cada 1 de sus objetivos en El País.

00:00:16.040 --> 00:00:23.400
Nos apoyamos muchísimo en su liderazgo, en su tecnología de punta y en su innovación continua.

00:00:23.800 --> 00:00:29.760
Microsoft le permite a Nico ser parte de un ecosistema tecnológico a nivel mundial más que un aliado para nosotros,

00:00:29.760 --> 00:00:33.880
más que un socio, realmente es un amigo, un amigo estratégico,

00:00:34.840 --> 00:00:39.800
incondicional, teniendo en cuenta y como principal razón de ser nuestra misión y visión,

00:00:40.080 --> 00:00:45.400
permitiendo que los salvadoreños puedan percatarse de su potencial. 25 años de experiencia.

00:00:45.680 --> 00:00:50.480
25 años impulsando, innovando y mejorando en cada una de nuestras facetas.

00:00:50.880 --> 00:00:58.080
Nuestra misión sigue intacta, empoderar a todas las personas y organizaciones del planeta a lograr más felices.

00:00:58.080 --> 00:01:01.240
25, Microsoft felices. 25, El Salvador.

00:01:01.480 --> 00:01:05.920
Juntos seguiremos innovando y progresando un mejor bienestar con tecnología.

WebVTT met JSON-eigenschappen

Het WebVTT-bestand met JSON-eigenschappen bevat metagegevens over het vertaalproces. Elk subtitelsegment bevat eigenschappen die aanvullende informatie over de vertaling bieden. Hier volgt een uitsplitsing van de eigenschappen:

  • globalMetadata: Deze sectie bevat metagegevens over de sprekers in de video. De eigenschap Sprekers is een object dat informatie over elke spreker bevat. Elke spreker wordt geïdentificeerd met een unieke id (bijvoorbeeld 'Speaker0'). De eigenschap defaultSsmlProperties bevat de standaard-SSML-eigenschappen voor de stem van de spreker.
  • id: Dit is een unieke id voor elk subtitelsegment. Het helpt bij het identificeren van het specifieke tekstsegment in het WebVTT-bestand.
  • speakerId: Deze eigenschap geeft de id van de luidspreker voor het bijbehorende subtitelsegment aan. Deze moet overeenkomen met de spreker-id die is gedefinieerd in de sectie globalMetadata.
  • ssmlProperties: Deze sectie bevat eigenschappen met betrekking tot de stem van de spreker. Het kan eigenschappen bevatten, zoals 'voiceName' en 'voiceKind'. De 'voiceName' is de naam van de stem die wordt gebruikt voor synthese en de 'voiceKind' geeft aan of het een platformstem of een persoonlijke stem is.
  • sourceLocaleText: Deze eigenschap bevat de oorspronkelijke tekst in de brontaal. Als u alleen wijzigingen aanbrengt aan sourceLocaleText, zal het systeem de bijgewerkte sourceLocaleText vertalen en de nieuwe vertaling gebruiken voor synthese. Als u wijzigingen aanbrengt in beide sourceLocaleText en translatedText, negeert het systeem de wijzigingen in sourceLocaleText en gebruikt het bijgewerkte translatedText voor synthese.
  • translatedText: Deze eigenschap bevat de vertaalde tekst in de doeltaal. Het vertegenwoordigt de tekst die wordt gesynthetiseerd in de vertaalde video. Als u alleen wijzigingen aanbrengt aan translatedText, gebruikt het systeem de bijgewerkte vertaalde tekst voor synthese.

Stap 4: Extra iteraties maken (optioneel)

U kunt extra iteraties maken om de kwaliteit van de vertaling te verbeteren. Het proces is vergelijkbaar met het maken van de eerste iteratie.

De webvttFile parameter is niet vereist bij het maken van de eerste iteratie. Vanaf de tweede iteratie moet u echter de webvttFile parameter opgeven in het iteratieproces. U moet het webvtt-bestand downloaden, de benodigde wijzigingen aanbrengen en het vervolgens uploaden naar uw Azure Blob-opslag. U moet de Blob-URL opgeven.

Als u uw video wilt vertalen of een iteratie wilt bijwerken voor een bestaande vertaling, moet u een HTTP PUT-aanvraagpad en hoofdtekst maken volgens de volgende instructies:

  • Geef de vereiste webvttFile invoerparameter op. De webvttFile parameter is vereist vanaf de tweede iteratie. U moet het meest recente webvtt-bestand downloaden, de gewenste wijzigingen aanbrengen en vervolgens uploaden naar uw Azure Blob-opslag. U moet de Blob-URL opgeven. Het subtitelbestand kan de indeling WebVTT of JSON hebben.
  • U kunt desgewenst nieuwe instellingen opgeven voor de nieuwe iteratie, zoals speakerCount, subtitleMaxCharCountPerSegmenten exportSubtitleInVideo.

Voor verificatie en autorisatie moet u de volgende headers en pad-ID's opnemen in uw aanvraag.

  • Stel de Operation-Id header in: de Operation-Id moet uniek zijn voor elke bewerking, zoals het maken van elke iteratie. Vervang Your-Operation-Id door een unieke id voor deze bewerking.
  • Vervang Your-Translation-Id in het pad. Gebruik dezelfde vertaal-id die u hebt opgegeven toen u de vertaling maakte. De vertalings-id blijft ongewijzigd.
  • Geef een nieuw iterationId in het pad op. De iteratie-id moet uniek zijn voor elke bewerking. Vervang door Your-Iteration-Id-2 een iteratie-id van uw keuze.
  • Vervang YourSpeechResourceKey door uw spraaksleutel en vervang YourSpeechResourceRegion door uw spraakregio.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" \
-H "Operation-Id: Your-Operation-Id" \
-H "Content-Type: application/json" \
-d '{
  "input": {
    "webvttFile": {
      "url": "https://YourBlobStorageUrl/YourWebVTTFile.vtt"
    }
  }
}' "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/translations/Your-Translation-Id/iterations/Your-Iteration-Id-2?api-version=2024-05-20"

U ontvangt een antwoordtekst in de volgende indeling:

{
  "input": {
    "webvttFile": {
      "url": "https://YourBlobStorageUrl/YourWebVTTFile.vtt"
    }
  },
  "status": "NotStarted",
  "lastActionDateTime": "2025-03-06T19:15:38.722Z",
  "id": "Your-Iteration-Id-2",
  "createdDateTime": "2025-03-06T19:15:38.722Z"
}

U kunt de bewerkings-id die u hebt opgegeven gebruiken en de API 'Get-bewerking op basis van bewerkings-id' periodiek uitvoeren totdat de geretourneerde status Succeeded of Failed is. Met deze bewerking kunt u de voortgang van het maken van het iteratieproces controleren. De statuseigenschap moet worden voortgezet van NotStarted tot Running, en ten slotte naar Succeeded of Failed.

Bewerking ophalen met bewerkings-id

Controleer de status van een bewerking met behulp van de bijbehorende bewerkings-id. De bewerkings-id is uniek voor elke bewerking, zodat u elke bewerking afzonderlijk kunt bijhouden. De bewerkings-id is geldig totdat de vertaling is verwijderd.

  • Geef hetzelfde Operation-Id op dat u hebt gebruikt bij het maken van de vertaling. In het voorbeeld Your-Operation-Id-1 wordt gebruikt. Vervang door Your-Operation-Id-1 een bewerkings-id van uw keuze.
  • Vervang YourSpeechResourceKey door uw spraaksleutel en vervang YourSpeechResourceRegion door uw spraakregio.
curl -v -X GET -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/operations/Your-Operation-Id-1?api-version=2024-05-20" 

U ontvangt een antwoordtekst in de volgende indeling:

{
  "id": "Your-Operation-Id-1",
  "status": "Running"
}

Een vertaling verwijderen met vertaal-id

Verwijder een specifieke vertaling die is geïdentificeerd door translationId. Met deze bewerking worden ook alle iteraties verwijderd die aan deze vertaling zijn gekoppeld.

Vervang YourSpeechResourceKey door de spraakresourcesleutel, YourSpeechResourceRegion door uw spraakresourceregio en Your-Translation-Id door de vertaal-id die u wilt verwijderen. Als deze niet handmatig wordt verwijderd, behoudt de service de vertaalgeschiedenis tot 31 dagen.

curl -v -X DELETE -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/translations/Your-Translation-Id?api-version=2024-05-20" 

De antwoordheaders bevatten HTTP/1.1 204 No Content als de verwijderaanvraag is geslaagd.

REST API-bewerkingen

U kunt de volgende REST API-bewerkingen gebruiken voor videoomzetting:

Operatie Methode REST API-aanroep
Een vertaling maken PUT /translations/{translationId}
Vertalingen vermelden GET /translations
Een vertaling ophalen via vertaal-id GET /translations/{translationId}
Een iteratie maken PUT /translations/{translationId}/iterations/{iterationId}
Iteraties weergeven GET /translations/{translationId}/iterations
Een iteratie ophalen via iteratie-id GET /translations/{translationId}/iterations/{iterationId}
Bewerking ophalen aan de hand van bewerkings-id GET /operations/{operationId}
Een vertaling verwijderen met vertaal-ID DELETE /translations/{translationId}

Zie GitHub voor codevoorbeelden.

Deze sectie bevat voorbeelden voor andere API-aanroepen voor videoomzetting die eerder niet gedetailleerd worden beschreven.

Vertalingen vermelden

Als u alle videovertalingen wilt weergeven die zijn geüpload en verwerkt in uw resourceaccount, maakt u een HTTP GET-aanvraag, zoals wordt weergegeven in het volgende voorbeeld. Vervang YourSpeechResourceKey door uw spraaksleutel en vervang YourSpeechResourceRegion door uw spraakregio.

curl -v -X GET -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/translations?api-version=2024-05-20"

Een vertaling ophalen op vertaal-id

Met deze bewerking wordt gedetailleerde informatie opgehaald over een specifieke vertaling, geïdentificeerd door de unieke vertaling translationId. Vervang YourSpeechResourceKey door de spraakresourcesleutel, YourSpeechResourceRegion door uw spraakresourceregio en Your-Translation-Id door de vertaal-id die u wilt controleren.

curl -v -X GET -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/translations/Your-Translation-Id?api-version=2024-05-20" 

Iteraties weergeven

Alle iteraties voor een specifieke vertaling weergeven. Deze aanvraag bevat alle iteraties zonder gedetailleerde informatie. Vervang YourSpeechResourceKey door de spraakresourcesleutel, YourSpeechResourceRegion door uw spraakresourceregio en Your-Translation-Id door de vertaal-id die u wilt controleren.

curl -v -X GET -H "Ocp-Apim-Subscription-Key: YourSpeechResourceKey" "https://YourSpeechResourceRegion.api.cognitive.microsoft.com/videotranslation/translations/Your-Translation-Id/iterations?api-version=2024-05-20"  

HTTP-statuscode

In de sectie worden de HTTP-antwoordcodes en -berichten van de REST API voor videovertaling beschreven.

HTTP 200 OK

HTTP 200 OK geeft aan dat de aanvraag is geslaagd.

HTTP 204 fout

Een HTTP 204-fout geeft aan dat de aanvraag is geslaagd, maar dat de resource niet bestaat. Voorbeeld:

  • U hebt geprobeerd een vertaling te verkrijgen of te verwijderen die niet bestaat.
  • U hebt een vertaling verwijderd.

HTTP foutmelding 400

Hier volgen voorbeelden die kunnen leiden tot de 400-fout:

  • De bron- of doellandinstelling die u hebt opgegeven, valt niet onder de ondersteunde landinstellingen.
  • U hebt geprobeerd een F0 Speech-resource te gebruiken, maar de regio ondersteunt alleen de prijscategorie Standard Speech-resources.

HTTP 500-fout

HTTP 500 Interne serverfout geeft aan dat de aanvraag is mislukt. De hoofdtekst van het antwoord bevat het foutbericht.