Esaminare l'output di Video Indexer di Intelligenza artificiale di Azure

Importante

A causa dell'annuncio di ritiro Servizi multimediali di Azure, Azure AI Video Indexer annuncia le modifiche alle funzionalità di Azure AI Video Indexer. Vedere Modifiche correlate al ritiro di Servizi multimediali di Azure (AMS) per comprendere cosa significa per l'account Video Indexer di Azure per intelligenza artificiale. Vedere la guida alla preparazione per il ritiro di AMS: aggiornamento VI e migrazione.

Quando viene indicizzato un video, Azure AI Video Indexer produce il contenuto JSON che contiene i dettagli delle informazioni dettagliate video specificate. Le informazioni dettagliate includono trascrizioni, elementi di riconoscimento ottico dei caratteri (OCR), visi, argomenti e dettagli simili. Ogni tipo di dati analitici include le istanze degli intervalli di tempo che mostrano quando i dati analitici vengono visualizzati nel video.

Per informazioni, vedere Informazioni dettagliate su Video Indexer per intelligenza artificiale di Azure.

Elementi radice delle informazioni dettagliate

Nome Descrizione
accountId ID account Video Indexer della playlist.
id ID della playlist.
name Nome della playlist.
description Descrizione della playlist.
userName Nome dell'utente che ha creato la playlist.
created Ora di creazione della playlist.
privacyMode Modalità privacy della playlist (Private o Public).
state Stato della playlist (Uploaded, Processing, Processed, Failedo Quarantined).
isOwned Indica se l'utente corrente ha creato la playlist.
isEditable Indica se l'utente corrente è autorizzato a modificare la playlist.
isBase Indica se la playlist è una playlist di base (un video) o una playlist composta da altri video (derivata).
durationInSeconds Durata totale della playlist.
summarizedInsights L'output JSON prodotto contiene Insights elementi e SummarizedInsights . È consigliabile usare e non usare InsightsSummarizedInsights (che è presente per la compatibilità con le versioni precedenti).
videos Elenco di video che costruiscono la playlist.
Se questa playlist viene costruita con intervalli di tempo di altri video (derivati), i video in questo elenco contengono solo i dati degli intervalli di tempo inclusi.
{
  ...
  "accountId": "00000000-0000-0000-0000-000000000000",
  "id": "abc3454321",
  "name": "My first video",
  "description": "I am trying VI",
  "userName": "Some name",
  "created": "2018/2/2 18:00:00.000",
  "privacyMode": "Private",
  "state": "Processed",
  "isOwned": true,
  "isEditable": false,
  "isBase": false,
  "durationInSeconds": 120, 
  "summarizedInsights" : null,
  "videos": [{ . . . }]
}

Suggerimento

L'output JSON prodotto contiene Insights elementi e SummarizedInsights . È consigliabile usare e non usare InsightsSummarizedInsights (che è presente per la compatibilità con le versioni precedenti).

Riepilogo delle informazioni dettagliate

Questa sezione mostra un riepilogo delle informazioni dettagliate.

Attributo Descrizione
name Nome del video. Ad esempio: Azure Monitor.
id ID del video. Ad esempio: 63c6d532ff.
privacyMode La suddivisione può avere una delle modalità seguenti: un Public video è visibile a tutti gli utenti dell'account e a chiunque abbia un collegamento al video. Un Private video è visibile a tutti gli utenti dell'account.
duration Ora in cui si è verificata un'informazione dettagliata, in secondi.
thumbnailVideoId ID del video da cui è stata ottenuta l'anteprima.
thumbnailId ID dell'anteprima del video. Per ottenere l'anteprima effettiva, chiamare Get-Thumbnail e passarlo thumbnailVideoId e thumbnailId.
faces Contiene zero o più visi. Per altre informazioni, vedere Visi.
keywords Contiene zero o più parole chiave. Per altre informazioni, vedere parole chiave.
sentiments Contiene zero o più sentimenti. Per altre informazioni, vedere Sentiments.For more information, see sentiments.
audioEffects Contiene zero o più effetti audio. Per altre informazioni, vedi audioEffects.
labels Contiene zero o più etichette. Per altre informazioni, vedere Etichette.
brands Contiene zero o più marchi. Per altre informazioni, vedere Marchi.
statistics Per altre informazioni, vedere statistics.
emotions Contiene zero o più emozioni. Per altre informazioni, vedere Emozioni.
topics Contiene zero o più argomenti. Per altre informazioni, vedere argomenti.

videos

Nome Descrizione
accountId ID account Video Indexer del video.
id ID del video.
name Nome del video.
state Stato del video (Uploaded, Processing, Processed, Failedo Quarantined).
processingProgress Stato durante l'elaborazione. Ad esempio: 20%.
failureCode Codice di errore se il video non è riuscito a elaborare. Ad esempio: UnsupportedFileType.
failureMessage Messaggio di errore se il video non è riuscito a elaborare.
externalId ID esterno del video (se l'utente ne specifica uno).
externalUrl URL esterno del video (se l'utente ne specifica uno).
metadata Metadati esterni del video (se l'utente ne specifica uno).
isAdult Indica se il video è stato esaminato e identificato manualmente come un video per adulti.
insights Oggetto insights. Per altre informazioni, vedere insights.
thumbnailId ID dell'anteprima del video. Per ottenere l'anteprima effettiva, chiama Get-Thumbnail e passa l'ID video e l'ID anteprima.
publishedUrl URL per lo streaming del video.
publishedUrlProxy URL per lo streaming del video nei dispositivi Apple.
viewToken Token di visualizzazione di breve durata per lo streaming del video.
sourceLanguage Lingua di origine del video.
language Lingua effettiva del video (traduzione).
indexingPreset Set di impostazioni usato per indicizzare il video.
streamingPreset Set di impostazioni usato per pubblicare il video.
linguisticModelId Modello di personalizzazione della trascrizione (CRIS) usato per trascrivere il video.
statistics Per altre informazioni, vedere statistics.
{
    "videos": [{
        "accountId": "2cbbed36-1972-4506-9bc7-55367912df2d",
        "id": "142a356aa6",
        "state": "Processed",
        "privacyMode": "Private",
        "processingProgress": "100%",
        "failureCode": "General",
        "failureMessage": "",
        "externalId": null,
        "externalUrl": null,
        "metadata": null,
        "insights": {. . . },
        "thumbnailId": "89d7192c-1dab-4377-9872-473eac723845",
        "publishedUrl": "https://videvmediaservices.streaming.mediaservices.windows.net:443/d88a652d-334b-4a66-a294-3826402100cd/Xamarine.ism/manifest",
        "publishedProxyUrl": null,
        "viewToken": "Bearer=<token>",
        "sourceLanguage": "En-US",
        "language": "En-US",
        "indexingPreset": "Default",
        "linguisticModelId": "00000000-0000-0000-0000-000000000000"
    }],
}

Informazioni dettagliate

Ogni informazioni dettagliate (ad esempio, righe di trascrizione, visi o marchi) contiene un elenco di elementi univoci (ad esempio, face1, face2, face3). Ogni elemento ha i propri metadati e un elenco delle relative istanze, che sono intervalli di tempo con metadati aggiuntivi.

Un viso potrebbe avere un ID, un nome, un'anteprima, altri metadati e un elenco delle relative istanze temporali , ad esempio , 00:00:05 – 00:00:1000:01:00 - 00:02:30e 00:41:21 – 00:41:49. Ogni istanza temporale può avere metadati aggiuntivi, Ad esempio, i metadati possono includere le coordinate del rettangolo del viso (20,230,60,60).

Versione Versione del codice
sourceLanguage Lingua di origine del video (presupponendo una lingua master), sotto forma di stringa BCP-47 .
language Lingua delle informazioni dettagliate (tradotta dalla lingua di origine), sotto forma di stringa BCP-47 .
transcript Informazioni dettagliate sulla trascrizione .
ocr Informazioni dettagliate su OCR .
keywords Informazioni dettagliate sulle parole chiave.
transcripts Può contenere una o più trascrizioni.
faces Informazioni dettagliate sui visi .
labels Informazioni dettagliate sulle etichette .
shots Le riprese sono dettagliate.
brands Informazioni dettagliate sui marchi .
audioEffects Informazioni dettagliate audioEffects .
sentiments Informazioni dettagliate sui sentimenti .
visualContentModeration Informazioni dettagliate su visualContentModeration .
textualContentModeration Informazioni dettagliate textualContentModeration .
emotions L'intuizione delle emozioni.
topics Informazioni dettagliate sugli argomenti .
speakers Informazioni dettagliate sugli altoparlanti .

Esempio:

{
  "version": "0.9.0.0",
  "sourceLanguage": "en-US",
  "language": "es-ES",
  "transcript": ...,
  "ocr": ...,
  "keywords": ...,
  "faces": ...,
  "labels": ...,
  "shots": ...,
  "brands": ...,
  "audioEffects": ...,
  "sentiments": ...,
  "visualContentModeration": ...,
  "textualContentModeration": ...
}

transcript

Nome Descrizione
id ID della riga.
text Testo della trascrizione.
confidence Livello di attendibilità per l'accuratezza della trascrizione.
speakerId ID dell'altoparlante.
language Lingua della trascrizione. È progettato per supportare le trascrizioni in cui ogni riga può avere un linguaggio diverso.
instances Elenco degli intervalli di tempo in cui è presente la riga. Se l'istanza è in una trascrizione, ha una sola istanza.

Esempio:

"transcript":[
{
  "id":1,
  "text":"Well, good morning everyone and welcome to",
  "confidence":0.8839,
  "speakerId":1,
  "language":"en-US",
  "instances":[
     {
    "adjustedStart":"0:00:10.21",
    "adjustedEnd":"0:00:12.81",
    "start":"0:00:10.21",
    "end":"0:00:12.81"
     }
  ]
},
{
  "id":2,
  "text":"ignite 2016. Your mission at Microsoft is to empower every",
  "confidence":0.8944,
  "speakerId":2,
  "language":"en-US",
  "instances":[
     {
    "adjustedStart":"0:00:12.81",
    "adjustedEnd":"0:00:17.03",
    "start":"0:00:12.81",
    "end":"0:00:17.03"
     }
  ]
}

ocr

Nome Descrizione
id ID riga di OCR.
text Testo del registro OCR.
confidence Grado di attendibilità del riconoscimento.
language Lingua del registro OCR.
instances Elenco di intervalli di tempo in cui è apparso questo OCR. Lo stesso OCR può essere visualizzato più volte.
height Altezza del rettangolo OCR.
top Posizione superiore, in pixel.
left Posizione sinistra, in pixel.
width Larghezza del rettangolo OCR.
angle Angolo del rettangolo OCR, da -180 a 180. Un valore indica 0 orizzontale da sinistra a destra. Un valore indica 90 il valore verticale dall'alto verso il basso. Un valore indica 180 orizzontale da destra a sinistra. Un valore indica -90 verticale dall'alto verso il basso. Un valore di 30 indica dall'alto a sinistra verso il basso a destra.
"ocr": [
    {
      "id": 0,
      "text": "LIVE FROM NEW YORK",
      "confidence": 675.971,
      "height": 35,
      "language": "en-US",
      "left": 31,
      "top": 97,
      "width": 400,
      "angle": 30,
      "instances": [
        {
          "start": "00:00:26",
          "end": "00:00:52"
        }
      ]
    }
  ],

parole chiave

Nome Descrizione
id ID della parola chiave.
text Testo della parola chiave.
confidence Attendibilità del riconoscimento nella parola chiave .
language Lingua della parola chiave, quando tradotta.
instances Elenco di intervalli di tempo in cui è presente questa parola chiave. Una parola chiave può essere visualizzata più volte.
{
    id: 0,
    text: "technology",
    confidence: 1,
    language: "en-US",
    instances: [{
            adjustedStart: "0:05:15.782",
            adjustedEnd: "0:05:16.249",
            start: "0:05:15.782",
            end: "0:05:16.249"
    },
    {
            adjustedStart: "0:04:54.761",
            adjustedEnd: "0:04:55.228",
            start: "0:04:54.761",
            end: "0:04:55.228"
    }]
}

faces

Se i visi sono presenti, Azure AI Video Indexer usa l'API Viso in tutti i fotogrammi del video per rilevare visi e celebrità.

Nome Descrizione
id ID del viso.
name Nome del viso. Può essere Unknown #0, una celebrità identificata o una persona addestrata dal cliente.
confidence Livello di attendibilità nell'identificazione del viso.
description Descrizione del personaggio noto.
thumbnailId ID dell'anteprima del viso.
knownPersonId Se si tratta di una persona nota, l'ID interno.
referenceId Se si tratta di una celebrità Bing, l'ID Bing.
referenceType Attualmente solo Bing.
title Se si tratta di una celebrità, il titolo della persona. Ad esempio: Microsoft's CEO.
imageUrl Se si tratta di una celebrità, l'URL dell'immagine.
instances Istanze di in cui il viso è apparso nell'intervallo di tempo. Ogni istanza ha anche un thumbnailsIds valore.
"faces": [{
    "id": 2002,
    "name": "Xam 007",
    "confidence": 0.93844,
    "description": null,
    "thumbnailId": "00000000-aee4-4be2-a4d5-d01817c07955",
    "knownPersonId": "8340004b-5cf5-4611-9cc4-3b13cca10634",
    "referenceId": null,
    "title": null,
    "imageUrl": null,
    "instances": [{
        "thumbnailsIds": ["00000000-9f68-4bb2-ab27-3b4d9f2d998e",
        "cef03f24-b0c7-4145-94d4-a84f81bb588c"],
        "adjustedStart": "00:00:07.2400000",
        "adjustedEnd": "00:00:45.6780000",
        "start": "00:00:07.2400000",
        "end": "00:00:45.6780000"
    },
    {
        "thumbnailsIds": ["00000000-51e5-4260-91a5-890fa05c68b0"],
        "adjustedStart": "00:10:23.9570000",
        "adjustedEnd": "00:10:39.2390000",
        "start": "00:10:23.9570000",
        "end": "00:10:39.2390000"
    }]
}]

Etichette

Nome Descrizione
id ID dell'etichetta.
name Nome dell'etichetta. Ad esempio, Computer o TV.
language Lingua del nome dell'etichetta (se tradotta), sotto forma di stringa BCP-47 .
instances Elenco di intervalli di tempo in cui è presente questa etichetta. Un'etichetta può essere visualizzata più volte. Ogni istanza ha un campo di confidenza.
"labels": [
    {
      "id": 0,
      "name": "person",
      "language": "en-US",
      "instances": [
        {
          "confidence": 1.0,
          "start": "00: 00: 00.0000000",
          "end": "00: 00: 25.6000000"
        },
        {
          "confidence": 1.0,
          "start": "00: 01: 33.8670000",
          "end": "00: 01: 39.2000000"
        }
      ]
    },
    {
      "name": "indoor",
      "language": "en-US",
      "id": 1,
      "instances": [
        {
          "confidence": 1.0,
          "start": "00: 00: 06.4000000",
          "end": "00: 00: 07.4670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 09.6000000",
          "end": "00: 00: 10.6670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 11.7330000",
          "end": "00: 00: 20.2670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 21.3330000",
          "end": "00: 00: 25.6000000"
        }
      ]
    }
  ] 

scenes

Nome Descrizione
id ID della scena.
instances Elenco di intervalli di tempo per questa scena. Una scena può avere una sola istanza.
"scenes":[  
    {  
      "id":0,
      "instances":[  
          {  
            "start":"0:00:00",
            "end":"0:00:06.34",
            "duration":"0:00:06.34"
          }
      ]
    },
    {  
      "id":1,
      "instances":[  
          {  
            "start":"0:00:06.34",
            "end":"0:00:47.047",
            "duration":"0:00:40.707"
          }
      ]
    },

]

shots

Nome Descrizione
id L'ID del colpo.
keyFrames Elenco di fotogrammi chiave all'interno dello scatto. Ognuno ha un ID e un elenco di intervalli di tempo dell'istanza. Ogni istanza del fotogramma chiave ha un thumbnailId campo che contiene l'ID anteprima del fotogramma chiave.
instances Elenco di intervalli di tempo per questo colpo. Un colpo può avere una sola istanza.
"shots":[  
    {  
      "id":0,
      "keyFrames":[  
          {  
            "id":0,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:00.209",
                  "end":"0:00:00.251",
                  "duration":"0:00:00.042"
                }
            ]
          },
          {  
            "id":1,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:04.755",
                  "end":"0:00:04.797",
                  "duration":"0:00:00.042"
                }
            ]
          }
      ],
      "instances":[  
          {  
            "start":"0:00:00",
            "end":"0:00:06.34",
            "duration":"0:00:06.34"
          }
      ]
    },

]

brands

Azure AI Video Indexer rileva i nomi dei marchi aziendali e di prodotto nella trascrizione vocale e/o nel video OCR. Queste informazioni non includono il riconoscimento visivo dei marchi o il rilevamento del logo.

Nome Descrizione
id ID del marchio.
name Nome del marchio.
referenceId Suffisso dell'URL di Wikipedia del marchio. Ad esempio, Target_Corporation è il suffisso di https://en.wikipedia.org/wiki/Target_Corporation.
referenceUrl URL wikipedia del marchio, se presente. Ad esempio: https://en.wikipedia.org/wiki/Target_Corporation.
description Descrizione del marchio.
tags Elenco di tag predefiniti associati a questo marchio.
confidence Valore di attendibilità del rilevatore di marchi di Azure AI Video Indexer (0-1).
instances Elenco di intervalli di tempo per questo marchio. Ogni istanza ha un brandType valore, che indica se questo marchio è apparso nella trascrizione o in un OCR.
"brands": [
{
    "id": 0,
    "name": "MicrosoftExcel",
    "referenceId": "Microsoft_Excel",
    "referenceUrl": "http: //en.wikipedia.org/wiki/Microsoft_Excel",
    "referenceType": "Wiki",
    "description": "Microsoft Excel is a sprea..",
    "tags": [],
    "confidence": 0.975,
    "instances": [
    {
        "brandType": "Transcript",
        "start": "00: 00: 31.3000000",
        "end": "00: 00: 39.0600000"
    }
    ]
},
{
    "id": 1,
    "name": "Microsoft",
    "referenceId": "Microsoft",
    "referenceUrl": "http: //en.wikipedia.org/wiki/Microsoft",
    "description": "Microsoft Corporation is...",
    "tags": [
    "competitors",
    "technology"
    ],
    "confidence": 1.0,
    "instances": [
    {
        "brandType": "Transcript",
        "start": "00: 01: 44",
        "end": "00: 01: 45.3670000"
    },
    {
        "brandType": "Ocr",
        "start": "00: 01: 54",
        "end": "00: 02: 45.3670000"
    }
    ]
}
]

statistiche

Nome Descrizione
CorrespondenceCount Numero di corrispondenze nel video.
SpeakerWordCount Numero di parole per ogni voce.
SpeakerNumberOfFragments Numero di frammenti presenti nell'altoparlante in un video.
SpeakerLongestMonolog Monologo più lungo della voce. Se l'altoparlante ha silenzio all'interno del monologo, è incluso. I periodi di silenzio all'inizio e alla fine del monologo vengono rimossi.
SpeakerTalkToListenRatio Il calcolo è basato sul tempo impiegato per il monologo della voce (senza i periodi di silenzio intermedi) diviso per il tempo totale del video. Il tempo viene arrotondato alla terza posizione decimale.

audioEffects (anteprima)

Nome Descrizione
id ID dell'effetto audio.
type Tipo dell'effetto audio.
name Tipo dell'effetto audio nel linguaggio in cui è stato indicizzato il codice JSON.
instances Elenco degli intervalli di tempo in cui è presente l'effetto audio. Ogni istanza ha un campo che indica il grado di attendibilità.
start + end Intervallo di tempo nel video originale.
adjustedStart + adjustedEnd Intervallo di tempo rispetto all'intervallo di tempo regolato.
audioEffects: [{
 {
        id: 0,
        type: "Laughter",
        name: "Laughter",
        instances: [{
                confidence: 0.8815,
                adjustedStart: "0:00:10.2",
                adjustedEnd: "0:00:11.2",
                start: "0:00:10.2",
                end: "0:00:11.2"
            }, {
                confidence: 0.8554,
                adjustedStart: "0:00:48.26",
                adjustedEnd: "0:00:49.56",
                start: "0:00:48.26",
                end: "0:00:49.56"
            }, {
                confidence: 0.8492,
                adjustedStart: "0:00:59.66",
                adjustedEnd: "0:01:00.66",
                start: "0:00:59.66",
                end: "0:01:00.66"
            }
        ]
    }
],

sentiments

I sentimenti vengono aggregati dal relativo sentimentType campo (Positive, Neutralo Negative). Ad esempio: 0-0.1, 0.1-0.2.

Nome Descrizione
id ID del sentiment.
averageScore Media di tutti i punteggi di tutte le istanze di quel tipo di sentiment.
instances Elenco degli intervalli di tempo in cui è presente la valutazione.
sentimentType Il tipo può essere Positive, Neutralo Negative.
"sentiments": [
{
    "id": 0,
    "averageScore": 0.87,
    "sentimentType": "Positive",
    "instances": [
    {
        "start": "00:00:23",
        "end": "00:00:41"
    }
    ]
}, {
    "id": 1,
    "averageScore": 0.11,
    "sentimentType": "Positive",
    "instances": [
    {
        "start": "00:00:13",
        "end": "00:00:21"
    }
    ]
}
]

visualContentModeration

La visualContentModeration trascrizione contiene intervalli di tempo rilevati da Azure AI Video Indexer per avere contenuto per adulti. Se visualContentModeration è vuoto, non è stato identificato alcun contenuto per adulti.

I video che contengono contenuti per adulti o spinti potrebbero essere disponibili solo per la visualizzazione privata. Gli utenti possono inviare una richiesta di revisione umana del contenuto. In tal caso, l'attributo IsAdult contiene il risultato della revisione umana.

Nome Descrizione
id ID della con modalità tenda ration dell'oggetto visivo.
adultScore Punteggio per adulti (da con modalità tenda ration).
racyScore Punteggio contenuti spinti (dalla moderazione del contenuto).
instances Elenco degli intervalli di tempo in cui è presente questa moderazione dei contenuti visivi.

Altre informazioni su visualContentModeration

"visualContentModeration": [
{
    "id": 0,
    "adultScore": 0.00069,
    "racyScore": 0.91129,
    "instances": [
    {
        "start": "00:00:25.4840000",
        "end": "00:00:25.5260000"
    }
    ]
},
{
    "id": 1,
    "adultScore": 0.99231,
    "racyScore": 0.99912,
    "instances": [
    {
        "start": "00:00:35.5360000",
        "end": "00:00:35.5780000"
    }
    ]
}
] 

textualContentModeration

Nome Descrizione
id ID della con modalità tenda ration testuale.
bannedWordsCount Numero di parole escluse.
bannedWordsRatio Rapporto tra parole escluse e numero totale di parole.
Altre informazioni su textualContentModeration

emotions

Azure AI Video Indexer identifica le emozioni in base ai segnali vocali e audio.

Nome Descrizione
id ID dell'emozione.
type Tipo di emozione identificata: Joy, Sadness, Angero Fear.
instances Elenco degli intervalli di tempo in cui è comparsa l'emozione.
"emotions": [{
    "id": 0,
    "type": "Fear",
    "instances": [{
      "adjustedStart": "0:00:39.47",
      "adjustedEnd": "0:00:45.56",
      "start": "0:00:39.47",
      "end": "0:00:45.56"
    },
    {
      "adjustedStart": "0:07:19.57",
      "adjustedEnd": "0:07:23.25",
      "start": "0:07:19.57",
      "end": "0:07:23.25"
    }]
  },
  {
    "id": 1,
    "type": "Anger",
    "instances": [{
      "adjustedStart": "0:03:55.99",
      "adjustedEnd": "0:04:05.06",
      "start": "0:03:55.99",
      "end": "0:04:05.06"
    },
    {
      "adjustedStart": "0:04:56.5",
      "adjustedEnd": "0:05:04.35",
      "start": "0:04:56.5",
      "end": "0:05:04.35"
    }]
  },
  {
    "id": 2,
    "type": "Joy",
    "instances": [{
      "adjustedStart": "0:12:23.68",
      "adjustedEnd": "0:12:34.76",
      "start": "0:12:23.68",
      "end": "0:12:34.76"
    },
    {
      "adjustedStart": "0:12:46.73",
      "adjustedEnd": "0:12:52.8",
      "start": "0:12:46.73",
      "end": "0:12:52.8"
    },
    {
      "adjustedStart": "0:30:11.29",
      "adjustedEnd": "0:30:16.43",
      "start": "0:30:11.29",
      "end": "0:30:16.43"
    },
    {
      "adjustedStart": "0:41:37.23",
      "adjustedEnd": "0:41:39.85",
      "start": "0:41:37.23",
      "end": "0:41:39.85"
    }]
  },
  {
    "id": 3,
    "type": "Sad",
    "instances": [{
      "adjustedStart": "0:13:38.67",
      "adjustedEnd": "0:13:41.3",
      "start": "0:13:38.67",
      "end": "0:13:41.3"
    },
    {
      "adjustedStart": "0:28:08.88",
      "adjustedEnd": "0:28:18.16",
      "start": "0:28:08.88",
      "end": "0:28:18.16"
    }]
  }
],

topics

Video Indexer di Azure per intelligenza artificiale crea un'inferenza degli argomenti principali delle trascrizioni. Quando possibile, viene inclusa la tassonomia IPTC di secondo livello.

Nome Descrizione
id ID dell'argomento.
name Nome dell'argomento. Ad esempio: Pharmaceuticals.
referenceId Percorsi di navigazione che riflettono la gerarchia dell'argomento. Ad esempio: HEALTH AND WELLBEING/MEDICINE AND HEALTHCARE/PHARMACEUTICALS.
confidence Punteggio di attendibilità nell'intervallo 0-1. A un punteggio maggiore corrisponde una maggiore attendibilità.
language Lingua usata nell'argomento.
iptcName Nome del codice per i media IPTC, se rilevato.
instances Attualmente, Video Indexer di Azure per intelligenza artificiale non indicizza un argomento agli intervalli di tempo. L'intero video viene usato come intervallo.
"topics": [{
    "id": 0,
    "name": "INTERNATIONAL RELATIONS",
    "referenceId": "POLITICS AND GOVERNMENT/FOREIGN POLICY/INTERNATIONAL RELATIONS",
    "referenceType": "VideoIndexer",
    "confidence": 1,
    "language": "en-US",
    "instances": [{
        "adjustedStart": "0:00:00",
        "adjustedEnd": "0:03:36.25",
        "start": "0:00:00",
        "end": "0:03:36.25"
    }]
}, {
    "id": 1,
    "name": "Politics and Government",
    "referenceType": "VideoIndexer",
    "iptcName": "Politics",
    "confidence": 0.9041,
    "language": "en-US",
    "instances": [{
        "adjustedStart": "0:00:00",
        "adjustedEnd": "0:03:36.25",
        "start": "0:00:00",
        "end": "0:03:36.25"
    }]
}]
. . .

Altoparlanti

Nome Descrizione
id ID dell'altoparlante.
name Nome dell'altoparlante sotto forma di Speaker #<number>. Ad esempio: Speaker #1.
instances Elenco di intervalli di tempo in cui è apparso questo altoparlante.
"speakers":[
{
  "id":1,
  "name":"Speaker #1",
  "instances":[
     {
    "adjustedStart":"0:00:10.21",
    "adjustedEnd":"0:00:12.81",
    "start":"0:00:10.21",
    "end":"0:00:12.81"
     }
  ]
},
{
  "id":2,
  "name":"Speaker #2",
  "instances":[
     {
    "adjustedStart":"0:00:12.81",
    "adjustedEnd":"0:00:17.03",
    "start":"0:00:12.81",
    "end":"0:00:17.03"
     }
  ]
},