Identifiera det talade språket automatiskt med modellen för språkidentifiering

Artikel
03/23/2024

Viktigt!

På grund av azure Media Services-tillbakadragandemeddelandet meddelar Azure AI Video Indexer att funktionsjusteringar för Azure AI Video Indexer har justerats. Mer information om vad detta innebär för ditt Azure AI Video Indexer-konto finns i Ändringar som rör tillbakadragning av Azure Media Service (AMS). Se guiden Förbereda för AMS-pensionering: VI-uppdatering och migrering.

Azure AI Video Indexer stöder automatisk språkidentifiering (LID), vilket är processen att automatiskt identifiera det talade språket från ljudinnehåll. Mediefilen transkriberas på det dominerande identifierade språket.

Se listan över språk som stöds av Azure AI Video Indexer på språk som stöds.

Läs avsnittet Riktlinjer och begränsningar .

Välja automatisk språkidentifiering vid indexering

När du indexerar eller indexerar om en video med hjälp av API:et auto detect väljer du alternativet i parametern sourceLanguage .

När du använder portalen går du till dina kontovideor på startsidan för Azure AI Video Indexer och hovra över namnet på videon som du vill indexera om. I det högra nedre hörnet väljer du knappen Omindexering . I dialogrutan Omindexering av video väljer du Automatisk identifiering i listrutan Videokällans språk.

Skärmbild som visar var du väljer automatisk identifiering.

Modell-utdata

Azure AI Video Indexer transkriberar videon enligt det mest sannolika språket om konfidensen för det språket är > 0.6. Om språket inte kan identifieras med förtroende förutsätter det att det talade språket är engelska.

Modelldominerande språk är tillgängligt i insights JSON som sourceLanguage attribut (under root/videos/insights). En motsvarande konfidenspoäng är också tillgänglig under attributet sourceLanguageConfidence .

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      }

Riktlinjer och begränsningar

Automatisk språkidentifiering (LID) stöder följande språk: