Esaminare l'output di Video Indexer di Intelligenza artificiale di Azure

Articolo
03/22/2024

Importante

A causa dell'annuncio di ritiro Servizi multimediali di Azure, Azure AI Video Indexer annuncia le modifiche alle funzionalità di Azure AI Video Indexer. Vedere Modifiche correlate al ritiro di Servizi multimediali di Azure (AMS) per comprendere cosa significa per l'account Video Indexer di Azure per intelligenza artificiale. Vedere la guida alla preparazione per il ritiro di AMS: aggiornamento VI e migrazione.

Quando viene indicizzato un video, Azure AI Video Indexer produce il contenuto JSON che contiene i dettagli delle informazioni dettagliate video specificate. Le informazioni dettagliate includono trascrizioni, elementi di riconoscimento ottico dei caratteri (OCR), visi, argomenti e dettagli simili. Ogni tipo di dati analitici include le istanze degli intervalli di tempo che mostrano quando i dati analitici vengono visualizzati nel video.

Per informazioni, vedere Informazioni dettagliate su Video Indexer per intelligenza artificiale di Azure.

Elementi radice delle informazioni dettagliate

Nome	Descrizione
`accountId`	ID account Video Indexer della playlist.
`id`	ID della playlist.
`name`	Nome della playlist.
`description`	Descrizione della playlist.
`userName`	Nome dell'utente che ha creato la playlist.
`created`	Ora di creazione della playlist.
`privacyMode`	Modalità privacy della playlist (`Private` o `Public`).
`state`	Stato della playlist (`Uploaded`, `Processing`, `Processed`, `Failed`o `Quarantined`).
`isOwned`	Indica se l'utente corrente ha creato la playlist.
`isEditable`	Indica se l'utente corrente è autorizzato a modificare la playlist.
`isBase`	Indica se la playlist è una playlist di base (un video) o una playlist composta da altri video (derivata).
`durationInSeconds`	Durata totale della playlist.
`summarizedInsights`	L'output JSON prodotto contiene `Insights` elementi e `SummarizedInsights` . È consigliabile usare e non usare `InsightsSummarizedInsights` (che è presente per la compatibilità con le versioni precedenti).
`videos`	Elenco di video che costruiscono la playlist. Se questa playlist viene costruita con intervalli di tempo di altri video (derivati), i video in questo elenco contengono solo i dati degli intervalli di tempo inclusi.

{
  ...
  "accountId": "00000000-0000-0000-0000-000000000000",
  "id": "abc3454321",
  "name": "My first video",
  "description": "I am trying VI",
  "userName": "Some name",
  "created": "2018/2/2 18:00:00.000",
  "privacyMode": "Private",
  "state": "Processed",
  "isOwned": true,
  "isEditable": false,
  "isBase": false,
  "durationInSeconds": 120, 
  "summarizedInsights" : null,
  "videos": [{ . . . }]
}

Suggerimento

L'output JSON prodotto contiene Insights elementi e SummarizedInsights . È consigliabile usare e non usare InsightsSummarizedInsights (che è presente per la compatibilità con le versioni precedenti).

Riepilogo delle informazioni dettagliate

Questa sezione mostra un riepilogo delle informazioni dettagliate.

Attributo	Descrizione
`name`	Nome del video. Ad esempio: `Azure Monitor`.
`id`	ID del video. Ad esempio: `63c6d532ff`.
`privacyMode`	La suddivisione può avere una delle modalità seguenti: un `Public` video è visibile a tutti gli utenti dell'account e a chiunque abbia un collegamento al video. Un `Private` video è visibile a tutti gli utenti dell'account.
`duration`	Ora in cui si è verificata un'informazione dettagliata, in secondi.
`thumbnailVideoId`	ID del video da cui è stata ottenuta l'anteprima.
`thumbnailId`	ID dell'anteprima del video. Per ottenere l'anteprima effettiva, chiamare Get-Thumbnail e passarlo `thumbnailVideoId` e `thumbnailId`.
`faces`	Contiene zero o più visi. Per altre informazioni, vedere Visi.
`keywords`	Contiene zero o più parole chiave. Per altre informazioni, vedere parole chiave.
`sentiments`	Contiene zero o più sentimenti. Per altre informazioni, vedere Sentiments.For more information, see sentiments.
`audioEffects`	Contiene zero o più effetti audio. Per altre informazioni, vedi audioEffects.
`labels`	Contiene zero o più etichette. Per altre informazioni, vedere Etichette.
`brands`	Contiene zero o più marchi. Per altre informazioni, vedere Marchi.
`statistics`	Per altre informazioni, vedere statistics.
`emotions`	Contiene zero o più emozioni. Per altre informazioni, vedere Emozioni.
`topics`	Contiene zero o più argomenti. Per altre informazioni, vedere argomenti.

videos

Nome	Descrizione
`accountId`	ID account Video Indexer del video.
`id`	ID del video.
`name`	Nome del video.
`state`	Stato del video (`Uploaded`, `Processing`, `Processed`, `Failed`o `Quarantined`).
`processingProgress`	Stato durante l'elaborazione. Ad esempio: `20%`.
`failureCode`	Codice di errore se il video non è riuscito a elaborare. Ad esempio: `UnsupportedFileType`.
`failureMessage`	Messaggio di errore se il video non è riuscito a elaborare.
`externalId`	ID esterno del video (se l'utente ne specifica uno).
`externalUrl`	URL esterno del video (se l'utente ne specifica uno).
`metadata`	Metadati esterni del video (se l'utente ne specifica uno).
`isAdult`	Indica se il video è stato esaminato e identificato manualmente come un video per adulti.
`insights`	Oggetto insights. Per altre informazioni, vedere insights.
`thumbnailId`	ID dell'anteprima del video. Per ottenere l'anteprima effettiva, chiama Get-Thumbnail e passa l'ID video e l'ID anteprima.
`publishedUrl`	URL per lo streaming del video.
`publishedUrlProxy`	URL per lo streaming del video nei dispositivi Apple.
`viewToken`	Token di visualizzazione di breve durata per lo streaming del video.
`sourceLanguage`	Lingua di origine del video.
`language`	Lingua effettiva del video (traduzione).
`indexingPreset`	Set di impostazioni usato per indicizzare il video.
`streamingPreset`	Set di impostazioni usato per pubblicare il video.
`linguisticModelId`	Modello di personalizzazione della trascrizione (CRIS) usato per trascrivere il video.
`statistics`	Per altre informazioni, vedere statistics.

{
    "videos": [{
        "accountId": "2cbbed36-1972-4506-9bc7-55367912df2d",
        "id": "142a356aa6",
        "state": "Processed",
        "privacyMode": "Private",
        "processingProgress": "100%",
        "failureCode": "General",
        "failureMessage": "",
        "externalId": null,
        "externalUrl": null,
        "metadata": null,
        "insights": {. . . },
        "thumbnailId": "89d7192c-1dab-4377-9872-473eac723845",
        "publishedUrl": "https://videvmediaservices.streaming.mediaservices.windows.net:443/d88a652d-334b-4a66-a294-3826402100cd/Xamarine.ism/manifest",
        "publishedProxyUrl": null,
        "viewToken": "Bearer=<token>",
        "sourceLanguage": "En-US",
        "language": "En-US",
        "indexingPreset": "Default",
        "linguisticModelId": "00000000-0000-0000-0000-000000000000"
    }],
}

Informazioni dettagliate

Ogni informazioni dettagliate (ad esempio, righe di trascrizione, visi o marchi) contiene un elenco di elementi univoci (ad esempio, face1, face2, face3). Ogni elemento ha i propri metadati e un elenco delle relative istanze, che sono intervalli di tempo con metadati aggiuntivi.

Un viso potrebbe avere un ID, un nome, un'anteprima, altri metadati e un elenco delle relative istanze temporali , ad esempio , 00:00:05 – 00:00:1000:01:00 - 00:02:30e 00:41:21 – 00:41:49. Ogni istanza temporale può avere metadati aggiuntivi, Ad esempio, i metadati possono includere le coordinate del rettangolo del viso (20,230,60,60).

Versione	Versione del codice
`sourceLanguage`	Lingua di origine del video (presupponendo una lingua master), sotto forma di stringa BCP-47 .
`language`	Lingua delle informazioni dettagliate (tradotta dalla lingua di origine), sotto forma di stringa BCP-47 .
`transcript`	Informazioni dettagliate sulla trascrizione .
`ocr`	Informazioni dettagliate su OCR .
`keywords`	Informazioni dettagliate sulle parole chiave.
`transcripts`	Può contenere una o più trascrizioni.
`faces`	Informazioni dettagliate sui visi .
`labels`	Informazioni dettagliate sulle etichette .
`shots`	Le riprese sono dettagliate.
`brands`	Informazioni dettagliate sui marchi .
`audioEffects`	Informazioni dettagliate audioEffects .
`sentiments`	Informazioni dettagliate sui sentimenti .
`visualContentModeration`	Informazioni dettagliate su visualContentModeration .
`textualContentModeration`	Informazioni dettagliate textualContentModeration .
`emotions`	L'intuizione delle emozioni.
`topics`	Informazioni dettagliate sugli argomenti .
`speakers`	Informazioni dettagliate sugli altoparlanti .

Esempio:

{
  "version": "0.9.0.0",
  "sourceLanguage": "en-US",
  "language": "es-ES",
  "transcript": ...,
  "ocr": ...,
  "keywords": ...,
  "faces": ...,
  "labels": ...,
  "shots": ...,
  "brands": ...,
  "audioEffects": ...,
  "sentiments": ...,
  "visualContentModeration": ...,
  "textualContentModeration": ...
}

transcript

Nome	Descrizione
`id`	ID della riga.
`text`	Testo della trascrizione.
`confidence`	Livello di attendibilità per l'accuratezza della trascrizione.
`speakerId`	ID dell'altoparlante.
`language`	Lingua della trascrizione. È progettato per supportare le trascrizioni in cui ogni riga può avere un linguaggio diverso.
`instances`	Elenco degli intervalli di tempo in cui è presente la riga. Se l'istanza è in una trascrizione, ha una sola istanza.

Esempio:

"transcript":[
{
  "id":1,
  "text":"Well, good morning everyone and welcome to",
  "confidence":0.8839,
  "speakerId":1,
  "language":"en-US",
  "instances":[
     {
    "adjustedStart":"0:00:10.21",
    "adjustedEnd":"0:00:12.81",
    "start":"0:00:10.21",
    "end":"0:00:12.81"
     }
  ]
},
{
  "id":2,
  "text":"ignite 2016. Your mission at Microsoft is to empower every",
  "confidence":0.8944,
  "speakerId":2,
  "language":"en-US",
  "instances":[
     {
    "adjustedStart":"0:00:12.81",
    "adjustedEnd":"0:00:17.03",
    "start":"0:00:12.81",
    "end":"0:00:17.03"
     }
  ]
}

ocr

Nome	Descrizione
`id`	ID riga di OCR.
`text`	Testo del registro OCR.
`confidence`	Grado di attendibilità del riconoscimento.
`language`	Lingua del registro OCR.
`instances`	Elenco di intervalli di tempo in cui è apparso questo OCR. Lo stesso OCR può essere visualizzato più volte.
`height`	Altezza del rettangolo OCR.
`top`	Posizione superiore, in pixel.
`left`	Posizione sinistra, in pixel.
`width`	Larghezza del rettangolo OCR.
`angle`	Angolo del rettangolo OCR, da `-180` a `180`. Un valore indica `0` orizzontale da sinistra a destra. Un valore indica `90` il valore verticale dall'alto verso il basso. Un valore indica `180` orizzontale da destra a sinistra. Un valore indica `-90` verticale dall'alto verso il basso. Un valore di `30` indica dall'alto a sinistra verso il basso a destra.

"ocr": [
    {
      "id": 0,
      "text": "LIVE FROM NEW YORK",
      "confidence": 675.971,
      "height": 35,
      "language": "en-US",
      "left": 31,
      "top": 97,
      "width": 400,
      "angle": 30,
      "instances": [
        {
          "start": "00:00:26",
          "end": "00:00:52"
        }
      ]
    }
  ],

parole chiave

Nome	Descrizione
`id`	ID della parola chiave.
`text`	Testo della parola chiave.
`confidence`	Attendibilità del riconoscimento nella parola chiave .
`language`	Lingua della parola chiave, quando tradotta.
`instances`	Elenco di intervalli di tempo in cui è presente questa parola chiave. Una parola chiave può essere visualizzata più volte.

{
    id: 0,
    text: "technology",
    confidence: 1,
    language: "en-US",
    instances: [{
            adjustedStart: "0:05:15.782",
            adjustedEnd: "0:05:16.249",
            start: "0:05:15.782",
            end: "0:05:16.249"
    },
    {
            adjustedStart: "0:04:54.761",
            adjustedEnd: "0:04:55.228",
            start: "0:04:54.761",
            end: "0:04:55.228"
    }]
}

faces

Se i visi sono presenti, Azure AI Video Indexer usa l'API Viso in tutti i fotogrammi del video per rilevare visi e celebrità.

Nome	Descrizione
`id`	ID del viso.
`name`	Nome del viso. Può essere `Unknown #0`, una celebrità identificata o una persona addestrata dal cliente.
`confidence`	Livello di attendibilità nell'identificazione del viso.
`description`	Descrizione del personaggio noto.
`thumbnailId`	ID dell'anteprima del viso.
`knownPersonId`	Se si tratta di una persona nota, l'ID interno.
`referenceId`	Se si tratta di una celebrità Bing, l'ID Bing.
`referenceType`	Attualmente solo Bing.
`title`	Se si tratta di una celebrità, il titolo della persona. Ad esempio: `Microsoft's CEO`.
`imageUrl`	Se si tratta di una celebrità, l'URL dell'immagine.
`instances`	Istanze di in cui il viso è apparso nell'intervallo di tempo. Ogni istanza ha anche un `thumbnailsIds` valore.

"faces": [{
    "id": 2002,
    "name": "Xam 007",
    "confidence": 0.93844,
    "description": null,
    "thumbnailId": "00000000-aee4-4be2-a4d5-d01817c07955",
    "knownPersonId": "8340004b-5cf5-4611-9cc4-3b13cca10634",
    "referenceId": null,
    "title": null,
    "imageUrl": null,
    "instances": [{
        "thumbnailsIds": ["00000000-9f68-4bb2-ab27-3b4d9f2d998e",
        "cef03f24-b0c7-4145-94d4-a84f81bb588c"],
        "adjustedStart": "00:00:07.2400000",
        "adjustedEnd": "00:00:45.6780000",
        "start": "00:00:07.2400000",
        "end": "00:00:45.6780000"
    },
    {
        "thumbnailsIds": ["00000000-51e5-4260-91a5-890fa05c68b0"],
        "adjustedStart": "00:10:23.9570000",
        "adjustedEnd": "00:10:39.2390000",
        "start": "00:10:23.9570000",
        "end": "00:10:39.2390000"
    }]
}]

Etichette

Nome	Descrizione
`id`	ID dell'etichetta.
`name`	Nome dell'etichetta. Ad esempio, `Computer` o `TV`.
`language`	Lingua del nome dell'etichetta (se tradotta), sotto forma di stringa BCP-47 .
`instances`	Elenco di intervalli di tempo in cui è presente questa etichetta. Un'etichetta può essere visualizzata più volte. Ogni istanza ha un campo di confidenza.

"labels": [
    {
      "id": 0,
      "name": "person",
      "language": "en-US",
      "instances": [
        {
          "confidence": 1.0,
          "start": "00: 00: 00.0000000",
          "end": "00: 00: 25.6000000"
        },
        {
          "confidence": 1.0,
          "start": "00: 01: 33.8670000",
          "end": "00: 01: 39.2000000"
        }
      ]
    },
    {
      "name": "indoor",
      "language": "en-US",
      "id": 1,
      "instances": [
        {
          "confidence": 1.0,
          "start": "00: 00: 06.4000000",
          "end": "00: 00: 07.4670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 09.6000000",
          "end": "00: 00: 10.6670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 11.7330000",
          "end": "00: 00: 20.2670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 21.3330000",
          "end": "00: 00: 25.6000000"
        }
      ]
    }
  ]

scenes

Nome	Descrizione
`id`	ID della scena.
`instances`	Elenco di intervalli di tempo per questa scena. Una scena può avere una sola istanza.

"scenes":[  
    {  
      "id":0,
      "instances":[  
          {  
            "start":"0:00:00",
            "end":"0:00:06.34",
            "duration":"0:00:06.34"
          }
      ]
    },
    {  
      "id":1,
      "instances":[  
          {  
            "start":"0:00:06.34",
            "end":"0:00:47.047",
            "duration":"0:00:40.707"
          }
      ]
    },

]

shots

Nome	Descrizione
`id`	L'ID del colpo.
`keyFrames`	Elenco di fotogrammi chiave all'interno dello scatto. Ognuno ha un ID e un elenco di intervalli di tempo dell'istanza. Ogni istanza del fotogramma chiave ha un `thumbnailId` campo che contiene l'ID anteprima del fotogramma chiave.
`instances`	Elenco di intervalli di tempo per questo colpo. Un colpo può avere una sola istanza.

"shots":[  
    {  
      "id":0,
      "keyFrames":[  
          {  
            "id":0,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:00.209",
                  "end":"0:00:00.251",
                  "duration":"0:00:00.042"
                }
            ]
          },
          {  
            "id":1,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:04.755",
                  "end":"0:00:04.797",
                  "duration":"0:00:00.042"
                }
            ]
          }
      ],
      "instances":[  
          {  
            "start":"0:00:00",
            "end":"0:00:06.34",
            "duration":"0:00:06.34"
          }
      ]
    },

]

brands

Azure AI Video Indexer rileva i nomi dei marchi aziendali e di prodotto nella trascrizione vocale e/o nel video OCR. Queste informazioni non includono il riconoscimento visivo dei marchi o il rilevamento del logo.

Nome	Descrizione
`id`	ID del marchio.
`name`	Nome del marchio.
`referenceId`	Suffisso dell'URL di Wikipedia del marchio. Ad esempio, `Target_Corporation` è il suffisso di https://en.wikipedia.org/wiki/Target_Corporation.
`referenceUrl`	URL wikipedia del marchio, se presente. Ad esempio: https://en.wikipedia.org/wiki/Target_Corporation.
`description`	Descrizione del marchio.
`tags`	Elenco di tag predefiniti associati a questo marchio.
`confidence`	Valore di attendibilità del rilevatore di marchi di Azure AI Video Indexer (`0`-`1`).
`instances`	Elenco di intervalli di tempo per questo marchio. Ogni istanza ha un `brandType` valore, che indica se questo marchio è apparso nella trascrizione o in un OCR.

"brands": [
{
    "id": 0,
    "name": "MicrosoftExcel",
    "referenceId": "Microsoft_Excel",
    "referenceUrl": "http: //en.wikipedia.org/wiki/Microsoft_Excel",
    "referenceType": "Wiki",
    "description": "Microsoft Excel is a sprea..",
    "tags": [],
    "confidence": 0.975,
    "instances": [
    {
        "brandType": "Transcript",
        "start": "00: 00: 31.3000000",
        "end": "00: 00: 39.0600000"
    }
    ]
},
{
    "id": 1,
    "name": "Microsoft",
    "referenceId": "Microsoft",
    "referenceUrl": "http: //en.wikipedia.org/wiki/Microsoft",
    "description": "Microsoft Corporation is...",
    "tags": [
    "competitors",
    "technology"
    ],
    "confidence": 1.0,
    "instances": [
    {
        "brandType": "Transcript",
        "start": "00: 01: 44",
        "end": "00: 01: 45.3670000"
    },
    {
        "brandType": "Ocr",
        "start": "00: 01: 54",
        "end": "00: 02: 45.3670000"
    }
    ]
}
]

statistiche

Nome	Descrizione
`CorrespondenceCount`	Numero di corrispondenze nel video.
`SpeakerWordCount`	Numero di parole per ogni voce.
`SpeakerNumberOfFragments`	Numero di frammenti presenti nell'altoparlante in un video.
`SpeakerLongestMonolog`	Monologo più lungo della voce. Se l'altoparlante ha silenzio all'interno del monologo, è incluso. I periodi di silenzio all'inizio e alla fine del monologo vengono rimossi.
`SpeakerTalkToListenRatio`	Il calcolo è basato sul tempo impiegato per il monologo della voce (senza i periodi di silenzio intermedi) diviso per il tempo totale del video. Il tempo viene arrotondato alla terza posizione decimale.

audioEffects (anteprima)

Nome	Descrizione
`id`	ID dell'effetto audio.
`type`	Tipo dell'effetto audio.
`name`	Tipo dell'effetto audio nel linguaggio in cui è stato indicizzato il codice JSON.
`instances`	Elenco degli intervalli di tempo in cui è presente l'effetto audio. Ogni istanza ha un campo che indica il grado di attendibilità.
`start` + `end`	Intervallo di tempo nel video originale.
`adjustedStart` + `adjustedEnd`	Intervallo di tempo rispetto all'intervallo di tempo regolato.

audioEffects: [{
 {
        id: 0,
        type: "Laughter",
        name: "Laughter",
        instances: [{
                confidence: 0.8815,
                adjustedStart: "0:00:10.2",
                adjustedEnd: "0:00:11.2",
                start: "0:00:10.2",
                end: "0:00:11.2"
            }, {
                confidence: 0.8554,
                adjustedStart: "0:00:48.26",
                adjustedEnd: "0:00:49.56",
                start: "0:00:48.26",
                end: "0:00:49.56"
            }, {
                confidence: 0.8492,
                adjustedStart: "0:00:59.66",
                adjustedEnd: "0:01:00.66",
                start: "0:00:59.66",
                end: "0:01:00.66"
            }
        ]
    }
],

sentiments

I sentimenti vengono aggregati dal relativo sentimentType campo (Positive, Neutralo Negative). Ad esempio: 0-0.1, 0.1-0.2.

Nome	Descrizione
`id`	ID del sentiment.
`averageScore`	Media di tutti i punteggi di tutte le istanze di quel tipo di sentiment.
`instances`	Elenco degli intervalli di tempo in cui è presente la valutazione.
`sentimentType`	Il tipo può essere `Positive`, `Neutral`o `Negative`.

"sentiments": [
{
    "id": 0,
    "averageScore": 0.87,
    "sentimentType": "Positive",
    "instances": [
    {
        "start": "00:00:23",
        "end": "00:00:41"
    }
    ]
}, {
    "id": 1,
    "averageScore": 0.11,
    "sentimentType": "Positive",
    "instances": [
    {
        "start": "00:00:13",
        "end": "00:00:21"
    }
    ]
}
]

visualContentModeration

La visualContentModeration trascrizione contiene intervalli di tempo rilevati da Azure AI Video Indexer per avere contenuto per adulti. Se visualContentModeration è vuoto, non è stato identificato alcun contenuto per adulti.

I video che contengono contenuti per adulti o spinti potrebbero essere disponibili solo per la visualizzazione privata. Gli utenti possono inviare una richiesta di revisione umana del contenuto. In tal caso, l'attributo IsAdult contiene il risultato della revisione umana.

Nome	Descrizione
`id`	ID della con modalità tenda ration dell'oggetto visivo.
`adultScore`	Punteggio per adulti (da con modalità tenda ration).
`racyScore`	Punteggio contenuti spinti (dalla moderazione del contenuto).
`instances`	Elenco degli intervalli di tempo in cui è presente questa moderazione dei contenuti visivi.

Altre informazioni su visualContentModeration

"visualContentModeration": [
{
    "id": 0,
    "adultScore": 0.00069,
    "racyScore": 0.91129,
    "instances": [
    {
        "start": "00:00:25.4840000",
        "end": "00:00:25.5260000"
    }
    ]
},
{
    "id": 1,
    "adultScore": 0.99231,
    "racyScore": 0.99912,
    "instances": [
    {
        "start": "00:00:35.5360000",
        "end": "00:00:35.5780000"
    }
    ]
}
]

textualContentModeration

Nome	Descrizione
`id`	ID della con modalità tenda ration testuale.
`bannedWordsCount`	Numero di parole escluse.
`bannedWordsRatio`	Rapporto tra parole escluse e numero totale di parole.

Altre informazioni su textualContentModeration

emotions

Azure AI Video Indexer identifica le emozioni in base ai segnali vocali e audio.

Nome	Descrizione
`id`	ID dell'emozione.
`type`	Tipo di emozione identificata: `Joy`, `Sadness`, `Anger`o `Fear`.
`instances`	Elenco degli intervalli di tempo in cui è comparsa l'emozione.

"emotions": [{
    "id": 0,
    "type": "Fear",
    "instances": [{
      "adjustedStart": "0:00:39.47",
      "adjustedEnd": "0:00:45.56",
      "start": "0:00:39.47",
      "end": "0:00:45.56"
    },
    {
      "adjustedStart": "0:07:19.57",
      "adjustedEnd": "0:07:23.25",
      "start": "0:07:19.57",
      "end": "0:07:23.25"
    }]
  },
  {
    "id": 1,
    "type": "Anger",
    "instances": [{
      "adjustedStart": "0:03:55.99",
      "adjustedEnd": "0:04:05.06",
      "start": "0:03:55.99",
      "end": "0:04:05.06"
    },
    {
      "adjustedStart": "0:04:56.5",
      "adjustedEnd": "0:05:04.35",
      "start": "0:04:56.5",
      "end": "0:05:04.35"
    }]
  },
  {
    "id": 2,
    "type": "Joy",
    "instances": [{
      "adjustedStart": "0:12:23.68",
      "adjustedEnd": "0:12:34.76",
      "start": "0:12:23.68",
      "end": "0:12:34.76"
    },
    {
      "adjustedStart": "0:12:46.73",
      "adjustedEnd": "0:12:52.8",
      "start": "0:12:46.73",
      "end": "0:12:52.8"
    },
    {
      "adjustedStart": "0:30:11.29",
      "adjustedEnd": "0:30:16.43",
      "start": "0:30:11.29",
      "end": "0:30:16.43"
    },
    {
      "adjustedStart": "0:41:37.23",
      "adjustedEnd": "0:41:39.85",
      "start": "0:41:37.23",
      "end": "0:41:39.85"
    }]
  },
  {
    "id": 3,
    "type": "Sad",
    "instances": [{
      "adjustedStart": "0:13:38.67",
      "adjustedEnd": "0:13:41.3",
      "start": "0:13:38.67",
      "end": "0:13:41.3"
    },
    {
      "adjustedStart": "0:28:08.88",
      "adjustedEnd": "0:28:18.16",
      "start": "0:28:08.88",
      "end": "0:28:18.16"
    }]
  }
],

topics

Video Indexer di Azure per intelligenza artificiale crea un'inferenza degli argomenti principali delle trascrizioni. Quando possibile, viene inclusa la tassonomia IPTC di secondo livello.

Nome	Descrizione
`id`	ID dell'argomento.
`name`	Nome dell'argomento. Ad esempio: `Pharmaceuticals`.
`referenceId`	Percorsi di navigazione che riflettono la gerarchia dell'argomento. Ad esempio: `HEALTH AND WELLBEING/MEDICINE AND HEALTHCARE/PHARMACEUTICALS`.
`confidence`	Punteggio di attendibilità nell'intervallo `0`-`1`. A un punteggio maggiore corrisponde una maggiore attendibilità.
`language`	Lingua usata nell'argomento.
`iptcName`	Nome del codice per i media IPTC, se rilevato.
`instances`	Attualmente, Video Indexer di Azure per intelligenza artificiale non indicizza un argomento agli intervalli di tempo. L'intero video viene usato come intervallo.

"topics": [{
    "id": 0,
    "name": "INTERNATIONAL RELATIONS",
    "referenceId": "POLITICS AND GOVERNMENT/FOREIGN POLICY/INTERNATIONAL RELATIONS",
    "referenceType": "VideoIndexer",
    "confidence": 1,
    "language": "en-US",
    "instances": [{
        "adjustedStart": "0:00:00",
        "adjustedEnd": "0:03:36.25",
        "start": "0:00:00",
        "end": "0:03:36.25"
    }]
}, {
    "id": 1,
    "name": "Politics and Government",
    "referenceType": "VideoIndexer",
    "iptcName": "Politics",
    "confidence": 0.9041,
    "language": "en-US",
    "instances": [{
        "adjustedStart": "0:00:00",
        "adjustedEnd": "0:03:36.25",
        "start": "0:00:00",
        "end": "0:03:36.25"
    }]
}]
. . .

Altoparlanti

Nome	Descrizione
`id`	ID dell'altoparlante.
`name`	Nome dell'altoparlante sotto forma di `Speaker #<number>`. Ad esempio: `Speaker #1`.
`instances`	Elenco di intervalli di tempo in cui è apparso questo altoparlante.

"speakers":[
{
  "id":1,
  "name":"Speaker #1",
  "instances":[
     {
    "adjustedStart":"0:00:10.21",
    "adjustedEnd":"0:00:12.81",
    "start":"0:00:10.21",
    "end":"0:00:12.81"
     }
  ]
},
{
  "id":2,
  "name":"Speaker #2",
  "instances":[
     {
    "adjustedStart":"0:00:12.81",
    "adjustedEnd":"0:00:17.03",
    "start":"0:00:12.81",
    "end":"0:00:17.03"
     }
  ]
},