Konfigurationsalternativ för indexering

2025-06-10

Du kan använda standardinställningarna för indexering eller justera dem. Du kan välja språk, indexering, anpassade modeller och strömningsinställningar som påverkar de insikter som genereras, kostnader och prestanda.

I den här artikeln beskrivs vart och ett av alternativen. Samma alternativ gäller när du använder Webbplatsen för Azure AI Video Indexer som för att använda API:et (se API-guiden). När du indexerar stora volymer, följ guiden för stor skala.

Standardinställningar

Som standard konfigureras Azure AI Video Indexer som:

Källspråk: Engelska
Sekretess: privat
Inställning för ljud och video: standard
Direktuppspelningskvalitet: enkel bithastighet

Videokällans språk

Om du känner till språket som talas i videon väljer du språket i listan över videokällor. Om du är osäker på språket i videon väljer du Identifiera ett enskilt språk automatiskt. Azure AI Video Indexer använder språkidentifiering (LID) för att identifiera videospråket och generera transkription och insikter med det identifierade språket.

Om videon innehåller flera språk och du inte är säker på vilka, väljer du Identifiera flera språk automatiskt. I det här fallet tillämpas identifiering av flera språk (MLID) vid uppladdning och indexering av din video.

Även om autodetect är ett bra alternativ när språket i dina videor varierar, finns det två saker att tänka på när du använder LID eller MLID:

LID/MLID stöder inte alla språk som stöds av Azure AI Video Indexer.
Transkriptionen är av högre kvalitet när du förväljer videons lämpliga språk.

Läs mer om språkstöd och språk som stöds.

Sekretess

Med det här alternativet kan du avgöra om insikterna endast ska vara tillgängliga för användare i ditt Azure AI Video Indexer-konto eller för någon med en länk.

Indexeringsalternativ

Var och en av alternativen för ljud- och videoindexering kan prissättas på olika sätt när du använder standardinställningarna för indexering. Mer information finns i Priser för Azure AI Video Indexer.

Följande är alternativen för indexeringstyp med information om de insikter som tillhandahålls. Om du vill ändra indexeringstypen väljer du Avancerade inställningar.

Kommentar

Optisk teckenigenkänning (OCR) används med flera insiktstyper.

Avancerade inställningar

När du väljer Avancerade inställningar kan du välja följande alternativ:

Endast ljud

Grundläggande: Indexerar och extraherar insikter med endast ljud (ignorerar video) och ger följande insikter:
- Transkription
- Översättning
- Formatering av utgångstexter och undertexter (dolda undertexter)
Standard: Indexerar och extraherar insikter med endast ljud (ignorera video) och ger följande insikter:
- Transkription
- Översättning
- Formatering av utgångstexter och undertexter (dolda undertexter)
- Automatisk språkidentifiering
- Känslor
- Nyckelord
- Namngivna entiteter (varumärken, platser, personer)
- Känslor
- Högtalare
- Ämnesextraktion
- Textinnehållsmoderering
Avancerat: Indexerar och extraherar insikter med endast ljud (ignorerar video) och ger följande insikter:
- Transkription
- Översättning
- Formatering av utgångstexter och undertexter (dolda undertexter)
- Automatisk språkidentifiering
- Identifiering av ljudhändelse
- Känslor
- Nyckelord
- Namngivna entiteter (varumärken, platser, personer)
- Känslor
- Högtalare
- Ämnesextraktion
- Textinnehållsmoderering

Endast video

Grundläggande: Indexerar och extraherar insikter med endast video (ignorerar ljud) och ger följande insikter:
- Etiketter
- Objektdetektering
- OCR (Optisk Teckenigenkänning)
- Scener (nyckelramar och bilder)
- Identifiering av svart ram
Standard: Indexerar och extraherar insikter med endast video (ignorerar ljud) och ger följande insikter:
- Etiketter (OCR)
- Namngivna entiteter (OCR – varumärken, platser, personer)
- OCR (Optisk Teckenigenkänning)
- Människor
- Scener (nyckelramar och bilder)
- Svarta ramar
- Visuell innehållsmoderering
- Extrahering av ämne (OCR)
Avancerat: Indexerar och extraherar insikter med endast video (ignorerar ljud) och ger följande insikter:
- Etiketter (OCR)
- Matchad person
- Namngivna entiteter (OCR – varumärken, platser, personer)
- OCR (Optisk Teckenigenkänning)
- Observerade personer
- Människor
- Scener (nyckelramar och bilder)
- Klaffbrädidentifiering
- Identifiering av digitala mönster
- Aktuella klädinsikter
- Textlös klappidentifiering
- Identifiering av textlogotyp
- Svarta ramar
- Visuell innehållsmoderering
- Extrahering av ämne (OCR)

Ljud och video

Grundläggande: Indexerar och extraherar insikter med hjälp av ljud och video och ger följande insikter:
- Transkription
- Översättning
- Formatering av utgångstexter och undertexter (dolda undertexter)
- Objektdetektering
- OCR (Optisk Teckenigenkänning)
- Scener (nyckelramar och bilder)
- Svarta ramar
Standard: Indexerar och extraherar insikter med hjälp av ljud och video och ger följande insikter:
- Transkription
- Översättning
- Formatering av utgångstexter och undertexter (dolda undertexter)
- Automatisk språkidentifiering
- Känslor
- Nyckelord
- Namngivna entiteter (varumärken, platser, personer)
- OCR (Optisk Teckenigenkänning)
- Scener (nyckelramar och bilder)
- Svarta ramar
- Visuell innehållsmoderering
- Människor
- Känslor
- Högtalare
- Ämnesextraktion
- Textinnehållsmoderering
Avancerat: Indexerar och extraherar insikter med hjälp av ljud och video och ger följande insikter:
- Transkription
- Översättning
- Formatering av utgångstexter och undertexter (dolda undertexter)
- Automatisk språkidentifiering
- Textinnehållsmoderering
- Identifiering av ljudhändelse
- Känslor
- Nyckelord
- Matchad person
- Namngivna entiteter (varumärken, platser, personer)
- OCR (Optisk Teckenigenkänning)
- Observerade personer
- Människor
- Klaffbrädidentifiering
- Identifiering av digitala mönster
- Aktuella klädinsikter
- Textlös klappidentifiering
- Känslor
- Högtalare
- Scener (nyckelramar och bilder)
- Identifiering av textlogotyp
- Svarta ramar
- Visuell innehållsmoderering
- Ämnesextraktion

Alternativ för direktuppspelningskvalitet

Det finns två alternativ för strömmande indexerade videor:

Enkel bithastighet: Om videohöjden är större än eller lika med 720p HD kodar Azure AI Video Indexer den med en upplösning på 1 280 x 720. Annars kodas den som 640 x 468.
Ingen direktuppspelning: Insikter genereras men ingen strömningsåtgärd utförs och videon är inte tillgänglig på Webbplatsen för Azure AI Video Indexer. När Ingen direktuppspelning har valts debiteras du inte för kodning.

Exkludera modeller

Du kan exkludera modeller när du indexerar via både VI-webbplatsen och API:et. När du laddar upp en video för att indexera med hjälp av webbplatsen väljer du Avancerade inställningar>Indexeringsförinställningar och väljer sedan de AI-modeller som ska undantas från indexeringsresultatet. Det kan möjliggöra effektivare indexering och VI-resultat som bara innehåller de insikter som du är intresserad av.

Anpassa innehållsmodeller

Med Azure AI Video Indexer kan du anpassa vissa av dess modeller så att de anpassas efter ditt specifika användningsfall. Dessa modeller omfattar varumärken, språk, person och tal.

Insikter och medielagring

I följande avsnitt beskrivs hur insikter och media lagras i Azure AI Video Indexer.

Insight Storage

Alla indexinsikter och metadata sparas i lagringskonton som hanteras av VI och du debiteras inte för den här lagringen.

Medielagring

Ditt VI-konto är anslutet till ett Azure Storage-konto. Du styr och betalar för användningen av det här lagringskontot. Följande filer lagras i det här kontot när en video indexeras:

Källfilen. Den behålls om du vill indexera om videon i framtiden.
En ny kodad fil när strömningskvaliteten är inställd på enkel bithastighet.

Ta bort media

Indexerade medier och alla dess associerade filer och insikter kan tas bort på tre sätt:

Ta bort filerna med Video Indexer-portalen.
Använd en begäran om att ta bort video eller ta bort videokällans fil-API .
Om du inte behöver lagra den ursprungliga mediefilen anger du parametern mellan 1 och 7 när du använder API:et retentionPeriod . Den indexerade videon och allt som är relaterat till den, källfilen, insikter osv. tas bort 1–7 dagar efter indexeringen.

Dokumentation om Azure AI Video Indexer

Dela via