Guida alla configurazione dell'indicizzazione

Importante

A causa dell'annuncio di ritiro Servizi multimediali di Azure, Azure AI Video Indexer annuncia le modifiche alle funzionalità di Azure AI Video Indexer. Vedere Modifiche correlate al ritiro di Servizi multimediali di Azure (AMS) per comprendere cosa significa per l'account Video Indexer di Azure per intelligenza artificiale. Vedere la guida alla preparazione per il ritiro di AMS: aggiornamento VI e migrazione.

È importante comprendere le opzioni di configurazione per indicizzare in modo efficiente assicurandosi di soddisfare gli obiettivi di indicizzazione. Durante l'indicizzazione dei video, gli utenti possono usare le impostazioni predefinite o regolare molte delle impostazioni. Video Indexer di Azure per intelligenza artificiale consente di scegliere tra una gamma di linguaggio, indicizzazione, modelli personalizzati e impostazioni di streaming che hanno implicazioni sulle informazioni dettagliate generate, sui costi e sulle prestazioni.

Questo articolo illustra ognuna delle opzioni e l'impatto di ogni opzione per abilitare decisioni informate durante l'indicizzazione. L'articolo illustra l'esperienza del sito Web di Video Indexer per intelligenza artificiale di Azure, ma le stesse opzioni si applicano quando si inviano processi tramite l'API (vedere la guida all'API). Quando si indicizzano volumi di grandi dimensioni, seguire la guida su larga scala.

La schermata di caricamento iniziale presenta opzioni per definire il nome del video, la lingua di origine e le impostazioni di privacy.

Screenshot che mostra le opzioni per definire il nome del video, la lingua di origine e le impostazioni di privacy.

Se si seleziona Opzioni avanzate, vengono visualizzate tutte le altre opzioni di impostazione.

Screenshot che mostra le opzioni avanzate per definire il nome del video, la lingua di origine e le impostazioni di privacy.

Impostazioni predefinite

Per impostazione predefinita, Video Indexer di Azure per intelligenza artificiale è configurato in una lingua di origine video in inglese, privacy dell'impostazione privata, audio e video standard e qualità di streaming di velocità in bit singola.

Suggerimento

In questo argomento vengono descritte in dettaglio ogni opzione di indicizzazione.

Di seguito sono riportati alcuni esempi di quando si usa l'impostazione predefinita potrebbe non essere una scelta ottimale:

  • Se sono necessarie informazioni dettagliate sulle persone osservate o sulla persona corrispondente disponibile solo tramite Advanced Video.
  • Se si usa solo Azure AI Video Indexer per la trascrizione e la traduzione, l'indicizzazione di audio e video non è necessaria, Basic per l'audio dovrebbe essere sufficiente.
  • Se si usano informazioni dettagliate di Video Indexer per intelligenza artificiale di Azure, ma non è necessario generare un nuovo file multimediale, lo streaming non è necessario e non è necessario selezionare Nessun flusso per evitare il processo di codifica e il costo associato.
  • Se un video è principalmente in una lingua che non è inglese.

Lingua di origine del video

Se si è a conoscenza della lingua parlata nel video, selezionare la lingua nell'elenco delle lingue di origine video. Se non si è certi della lingua del video, scegliere Rileva automaticamente una singola lingua. Durante il caricamento e l'indicizzazione del video, Azure AI Video Indexer userà l'identificazione della lingua (LID) per rilevare la lingua dei video e generare trascrizioni e informazioni dettagliate con la lingua rilevata.

Se il video può contenere più lingue e non si è certi di quali, selezionare Rileva automaticamente più lingue. In questo caso, durante il caricamento e l'indicizzazione del video verrà applicato il rilevamento di più lingue (MLID).

Anche se il rilevamento automatico è un'ottima opzione quando la lingua nei video varia, esistono due punti da considerare quando si usa LID o MLID:

  • LID/MLID non supportano tutti i linguaggi supportati da Azure AI Video Indexer.
  • La trascrizione è di qualità superiore quando si pre-seleziona la lingua appropriata del video.

Altre informazioni sul supporto linguistico e sulle lingue supportate.

Riservatezza

Questa opzione consente di determinare se le informazioni dettagliate devono essere accessibili solo agli utenti nell'account Di Azure AI Video Indexer o a chiunque abbia un collegamento.

Opzioni di indicizzazione

Quando si indicizza un video con le impostazioni predefinite, tenere presente che ognuna delle opzioni di indicizzazione audio e video può essere prezzo diversamente. Per informazioni dettagliate, vedere Prezzi di Video Indexer per intelligenza artificiale di Azure.

Di seguito sono riportate le opzioni del tipo di indicizzazione con i dettagli delle informazioni dettagliate fornite. Per modificare il tipo di indicizzazione, selezionare Impostazioni avanzate.

Solo audio Solo video Audio e video
Di base Di base Di base
Standard Standard Standard
Avanzato Avanzato Avanzato

Impostazioni avanzate

Solo audio

  • Base: indici ed estrarre informazioni dettagliate usando solo audio (ignorando il video) e fornisce le informazioni dettagliate seguenti: trascrizione, traduzione, formattazione dei didascalia di output e sottotitoli (didascalia chiuse).
  • Standard: indicizza ed estrae informazioni dettagliate usando solo audio (ignorando il video) e fornisce le informazioni dettagliate seguenti: trascrizione, traduzione, formattazione dei didascalia di output e sottotitoli (didascalia chiusi), rilevamento automatico della lingua, emozioni, parole chiave, entità denominate (marchi, posizioni, persone), sentiment, relatori, estrazione di argomenti e conuali modalità tenda ration.
  • Avanzato: indicizza ed estrae informazioni dettagliate usando solo audio (ignorando il video) e fornisce le informazioni dettagliate seguenti: trascrizione, traduzione, formattazione dei didascalia di output e sottotitoli (didascalia chiusi), rilevamento automatico della lingua, rilevamento degli eventi audio, emozioni, parole chiave, entità denominate (marchi, località, persone), sentiment, relatori, estrazione di argomenti e con testualimodalità tenda ration.

Solo video

  • Base: indici ed estrarre informazioni dettagliate usando solo video (ignorando l'audio) e fornisce le informazioni dettagliate seguenti: etichette, rilevamento oggetti, OCR, scene (fotogrammi chiave e scatti) e rilevamento dei fotogrammi neri.
  • Standard: indicizza ed estrae informazioni dettagliate usando solo video (ignorando l'audio) e fornisce le informazioni dettagliate seguenti: etichette (OCR), entità denominate (OCR - marchi, località, persone), OCR, persone, scene (fotogrammi chiave e scatti), fotogrammi neri, con modalità tenda ration ed estrazione di argomenti (OCR).
  • Avanzate: indici ed estrarre informazioni dettagliate usando solo video (ignorando l'audio) e fornisce le informazioni dettagliate seguenti: etichette (OCR), persona abbinata (anteprima), entità denominate (OCR - marchi, località, persone), OCR, persone osservate (anteprima), persone, scene (fotogrammi chiave e scatti), rilevamento clapperboard, rilevamento di modelli digitali, informazioni dettagliate sull'abbigliamento in primo piano, rilevamento degli slate senza testo, rilevamento di logo testuali, fotogrammi neri, visualizzazione con modalità tendaration, and topic extraction (OCR).

Audio e video

  • Base: indici ed estrarre informazioni dettagliate usando audio e video e fornisce le informazioni dettagliate seguenti: trascrizione, traduzione, formattazione dei didascalia di output e sottotitoli (didascalia chiusi), rilevamento degli oggetti, OCR, scene (fotogrammi chiave e scatti) e fotogrammi neri.
  • Standard: indici ed estrarre informazioni dettagliate usando audio e video e fornisce le informazioni dettagliate seguenti: trascrizione, traduzione, formattazione dei didascalia di output e sottotitoli (didascalia chiuse), rilevamento automatico della lingua, emozioni, parole chiave, entità denominate (marchi, posizioni, persone), OCR, scene (fotogrammi chiave e scatti), fotogrammi neri, elementi visivi modalità tendaration, people, sentiments, speaker, topic extraction e textual con modalità tenda ration.
  • Avanzate: indici ed estrarre informazioni dettagliate usando audio e video e fornisce le informazioni dettagliate seguenti: trascrizione, traduzione, formattazione dei didascalia di output e sottotitoli (didascalia chiuse), rilevamento automatico della lingua, conuale modalità tendaration, audio event detection, emotions, keywords, matched person, named entities (brands, locations, people), OCR, observed people (preview), people, clapperboard detection, digital pattern detection, featured clothing insight, textless slate detection, textless slate detection, sentiments, speaker, scenes (keyframes and shots), textual logo detection, black frame, visual con modalità tenda ration ed estrazione di argomenti.

Opzioni di qualità dello streaming

Sono disponibili due opzioni per lo streaming di video indicizzati:

  • Velocità in bit singola: se l'altezza del video è maggiore o uguale a 720p HD, Azure AI Video Indexer lo codifica con una risoluzione di 1280 x 720. In caso contrario, viene codificato come 640 x 468.
  • Nessun flusso: le informazioni dettagliate vengono generate ma non viene eseguita alcuna operazione di streaming e il video non è disponibile nel sito Web di Azure AI Video Indexer. Quando non è selezionato Nessun flusso, non viene addebitato alcun costo per la codifica.

Personalizzazione dei modelli di contenuto

Video Indexer di Intelligenza artificiale di Azure consente di personalizzare alcuni dei relativi modelli da adattare al caso d'uso specifico. Questi modelli includono marchi, lingua e persona. Se si dispone di modelli personalizzati, questa sezione consente di configurare se uno dei modelli creati deve essere usato per l'indicizzazione.