Delen via


De Uitvoer van Azure AI Video Indexer onderzoeken

Waarschuwing

In het afgelopen jaar kondigde Azure AI Video Indexer (VI) de verwijdering aan van de afhankelijkheid van Azure Media Services (AMS) vanwege de buitengebruikstelling. Er zijn aanpassingen en wijzigingen van functies aangekondigd en er is een migratiehandleiding gegeven.

De deadline voor het voltooien van de migratie was 30 juni 2024. VI heeft de deadline voor het bijwerken/migreren verlengd, zodat u uw VI-account kunt bijwerken en u kunt aanmelden voor de migratie van AMS VI-assets tot en met 15 juli 2024. Als u de AMS VI-assetmigratie wilt gebruiken, moet u uw AMS-account ook uitbreiden tot juli. Navigeer naar uw AMS-account in Azure Portal en selecteer Klik hier om uit te breiden.

Als u na 30 juni uw VI-account niet hebt bijgewerkt, kunt u echter geen nieuwe video's indexeren en kunt u ook geen video's afspelen die niet zijn gemigreerd. Als u uw account na 30 juni bijwerkt, kunt u de indexering onmiddellijk hervatten, maar kunt u video's die zijn geïndexeerd niet afspelen vóór de accountupdate totdat ze zijn gemigreerd via de AMS VI-migratie.

Wanneer een video wordt geïndexeerd, produceert Azure AI Video Indexer de JSON-inhoud die details van de opgegeven video-inzichten bevat. De inzichten omvatten transcripties, optische tekenherkenningselementen (OCR's), gezichten, onderwerpen en vergelijkbare details. Elk type inzicht bevat tijdsbereikwaarden die aangeven waar het inzicht voorkomt in de video.

Zie Inzichten in Azure AI Video Indexer voor meer informatie.

Hoofdelementen van de inzichten

Name Beschrijving
accountId De VI-account-id van de afspeellijst.
id De id van de afspeellijst.
name De naam van de afspeellijst.
description De beschrijving van de afspeellijst.
userName De naam van de gebruiker die de afspeellijst heeft gemaakt.
created De aanmaaktijd van de afspeellijst.
privacyMode De privacymodus van de afspeellijst (Private of Public).
state De status van de afspeellijst (Uploaded, Processing, Processed, Failedof Quarantined).
isOwned Geeft aan of de huidige gebruiker de afspeellijst heeft gemaakt.
isEditable Geeft aan of de huidige gebruiker gemachtigd is om de afspeellijst te bewerken.
isBase Geeft aan of de afspeellijst een basisafspeellijst (een video) of een afspeellijst is gemaakt van andere video's (afgeleid).
durationInSeconds De totale duur van de afspeellijst.
summarizedInsights De geproduceerde JSON-uitvoer bevat Insights en SummarizedInsights elementen. U wordt aangeraden deze te gebruiken en niet te gebruiken Insights SummarizedInsights (die aanwezig is voor achterwaartse compatibiliteit).
videos Een lijst met video's die de afspeellijst samenstellen.
Als deze afspeellijst bestaat uit tijdsbereiken van andere video's (afgeleid), bevatten de video's in deze lijst alleen gegevens uit de opgenomen tijdsbereiken.
{
  ...
  "accountId": "00000000-0000-0000-0000-000000000000",
  "id": "abc3454321",
  "name": "My first video",
  "description": "I am trying VI",
  "userName": "Some name",
  "created": "2018/2/2 18:00:00.000",
  "privacyMode": "Private",
  "state": "Processed",
  "isOwned": true,
  "isEditable": false,
  "isBase": false,
  "durationInSeconds": 120, 
  "summarizedInsights" : null,
  "videos": [{ . . . }]
}

Tip

De geproduceerde JSON-uitvoer bevat Insights en SummarizedInsights elementen. We raden u ten zeerste aan gebruik te maken Insights en niet te gebruiken SummarizedInsights (die aanwezig is voor achterwaartse compatibiliteit).

Samenvatting van de inzichten

In deze sectie ziet u een samenvatting van de inzichten.

Kenmerk Beschrijving
name De naam van de video. Voorbeeld: Azure Monitor.
id De id van de video. Voorbeeld: 63c6d532ff.
privacyMode Uw uitsplitsing kan een van de volgende modi hebben: een Public video is zichtbaar voor iedereen in uw account en iedereen die een koppeling naar de video heeft. Een Private video is zichtbaar voor iedereen in uw account.
duration De tijd waarop een inzicht plaatsvond, in seconden.
thumbnailVideoId De id van de video waaruit de miniatuur is genomen.
thumbnailId De miniatuur-id van de video. Als u de werkelijke miniatuur wilt ophalen, roept u Get-Thumbnail aan en geeft u deze thumbnailVideoId door en thumbnailId.
faces Bevat nul of meer gezichten. Zie gezichten voor meer informatie.
keywords Bevat nul of meer trefwoorden. Zie trefwoorden voor meer informatie.
sentiments Bevat nul of meer gevoelens. Zie sentimenten voor meer informatie.
audioEffects Bevat nul of meer audio-effecten. Zie audioEffects voor meer informatie.
labels Bevat nul of meer labels. Zie labels voor meer informatie.
brands Bevat nul of meer merken. Zie merken voor meer informatie.
statistics Zie statistieken voor meer informatie.
emotions Bevat nul of meer emoties. Zie emoties voor meer informatie.
topics Bevat nul of meer onderwerpen. Zie onderwerpen voor meer informatie.

Video 's

Name Beschrijving
accountId De VI-account-id van de video.
id De id van de video.
name De naam van de video.
state De status van de video (Uploaded, Processing, Processed, Failedof ).Quarantined
processingProgress De voortgang tijdens de verwerking. Voorbeeld: 20%.
failureCode De foutcode als de video niet kan worden verwerkt. Voorbeeld: UnsupportedFileType.
failureMessage Het foutbericht als de video niet kan worden verwerkt.
externalId De externe id van de video (als de gebruiker er een opgeeft).
externalUrl De externe URL van de video (als de gebruiker er een opgeeft).
metadata De externe metagegevens van de video (als de gebruiker er een opgeeft).
isAdult Geeft aan of de video handmatig is gecontroleerd en geïdentificeerd als een video voor volwassenen.
insights Het inzichtenobject. Zie inzichten voor meer informatie.
thumbnailId De miniatuur-id van de video. Als u de werkelijke miniatuur wilt ophalen, roept u Get-Thumbnail aan en geeft u deze door aan de video-id en miniatuur-id.
publishedUrl Een URL om de video te streamen.
publishedUrlProxy Een URL voor het streamen van de video op Apple-apparaten.
viewToken Een kortstondige weergavetoken voor het streamen van de video.
sourceLanguage De brontaal van de video.
language De werkelijke taal (vertaling) van de video.
indexingPreset De voorinstelling die wordt gebruikt om de video te indexeren.
streamingPreset De voorinstelling die wordt gebruikt om de video te publiceren.
linguisticModelId Het CRIS-model (transcript aanpassing) dat wordt gebruikt om de video te transcriberen.
statistics Zie statistieken voor meer informatie.
{
    "videos": [{
        "accountId": "2cbbed36-1972-4506-9bc7-55367912df2d",
        "id": "142a356aa6",
        "state": "Processed",
        "privacyMode": "Private",
        "processingProgress": "100%",
        "failureCode": "General",
        "failureMessage": "",
        "externalId": null,
        "externalUrl": null,
        "metadata": null,
        "insights": {. . . },
        "thumbnailId": "89d7192c-1dab-4377-9872-473eac723845",
        "publishedUrl": "https://videvmediaservices.streaming.mediaservices.windows.net:443/d88a652d-334b-4a66-a294-3826402100cd/Xamarine.ism/manifest",
        "publishedProxyUrl": null,
        "viewToken": "Bearer=<token>",
        "sourceLanguage": "En-US",
        "language": "En-US",
        "indexingPreset": "Default",
        "linguisticModelId": "00000000-0000-0000-0000-000000000000"
    }],
}

inzichten

Elk inzicht (bijvoorbeeld transcriptlijnen, gezichten of merken) bevat een lijst met unieke elementen (bijvoorbeeld face1, face2, face3). Elk element heeft zijn eigen metagegevens en een lijst met exemplaren. Dit zijn tijdsbereiken met aanvullende metagegevens.

Een gezicht kan een id, een naam, een miniatuur, andere metagegevens en een lijst met tijdelijke exemplaren hebben (bijvoorbeeld 00:00:05 – 00:00:1000:01:00 - 00:02:30, en 00:41:21 – 00:41:49). Elk tijdelijk exemplaar kan extra metagegevens bevatten. De metagegevens kunnen bijvoorbeeld de rechthoekcoördinaten (20,230,60,60) van het gezicht bevatten.

Versie De codeversie
sourceLanguage De brontaal van de video (ervan uitgaande van één hoofdtaal), in de vorm van een BCP-47-tekenreeks .
language De inzichtentaal (vertaald uit de brontaal), in de vorm van een BCP-47-tekenreeks .
transcript Het inzicht in transcriptie .
ocr Het OCR-inzicht .
keywords Het inzicht in trefwoorden .
transcripts Kan een of meer transcripties bevatten.
faces Het gezicht inzicht.
labels Het inzicht in labels .
shots De shots inzicht.
brands Het merken inzicht.
audioEffects Het inzicht audioEffects .
sentiments Het inzicht in sentimenten .
visualContentModeration Het inzicht in visualContentModeration .
textualContentModeration Het inzicht in textualContentModeration .
emotions Het inzicht in emoties .
topics Het inzicht in onderwerpen .
speakers Het inzicht van de sprekers .

Voorbeeld:

{
  "version": "0.9.0.0",
  "sourceLanguage": "en-US",
  "language": "es-ES",
  "transcript": ...,
  "ocr": ...,
  "keywords": ...,
  "faces": ...,
  "labels": ...,
  "shots": ...,
  "brands": ...,
  "audioEffects": ...,
  "sentiments": ...,
  "visualContentModeration": ...,
  "textualContentModeration": ...
}

afschrift

Name Beschrijving
id De regel-id.
text Het transcript zelf.
confidence Het betrouwbaarheidsniveau voor de nauwkeurigheid van transcripties.
speakerId De id van de spreker.
language De transcripttaal. Het is bedoeld om transcripties te ondersteunen waarbij elke regel een andere taal kan hebben.
instances Een lijst met tijdsbereiken waarin deze regel werd weergegeven. Als het exemplaar zich in een transcriptie bevindt, heeft het slechts één exemplaar.

Voorbeeld:

"transcript":[
{
  "id":1,
  "text":"Well, good morning everyone and welcome to",
  "confidence":0.8839,
  "speakerId":1,
  "language":"en-US",
  "instances":[
     {
    "adjustedStart":"0:00:10.21",
    "adjustedEnd":"0:00:12.81",
    "start":"0:00:10.21",
    "end":"0:00:12.81"
     }
  ]
},
{
  "id":2,
  "text":"ignite 2016. Your mission at Microsoft is to empower every",
  "confidence":0.8944,
  "speakerId":2,
  "language":"en-US",
  "instances":[
     {
    "adjustedStart":"0:00:12.81",
    "adjustedEnd":"0:00:17.03",
    "start":"0:00:12.81",
    "end":"0:00:17.03"
     }
  ]
}

Ocr

Name Beschrijving
id De regel-id van de OCR.
text De tekst van de OCR.
confidence Het herkenningsvertrouwen.
language De taal van de OCR.
instances Een lijst met tijdsbereiken waarin deze OCR werd weergegeven. (Dezelfde OCR kan meerdere keren worden weergegeven.)
height De hoogte van de OCR-rechthoek.
top De bovenste locatie, in pixels.
left De linkerlocatie, in pixels.
width De breedte van de OCR-rechthoek.
angle De hoek van de OCR-rechthoek, van -180 tot 180. Een waarde van de waarde van 0 'van links naar rechts' horizontaal. Een waarde van 90 de boven-naar-beneden-verticale waarde. Een waarde van de waarde van 180 rechts naar links horizontaal. Een waarde van -90 'bottom-to-top' verticaal. Een waarde van 30 de middelen van linksboven naar rechtsonder.
"ocr": [
    {
      "id": 0,
      "text": "LIVE FROM NEW YORK",
      "confidence": 675.971,
      "height": 35,
      "language": "en-US",
      "left": 31,
      "top": 97,
      "width": 400,
      "angle": 30,
      "instances": [
        {
          "start": "00:00:26",
          "end": "00:00:52"
        }
      ]
    }
  ],

keywords

Name Beschrijving
id De id van het trefwoord.
text De tekst van het trefwoord.
confidence Herkenningsvertrouwen in het trefwoord.
language De trefwoordtaal (wanneer vertaald).
instances Een lijst met tijdsbereiken waarin dit trefwoord werd weergegeven. (Een trefwoord kan meerdere keren worden weergegeven.)
{
    id: 0,
    text: "technology",
    confidence: 1,
    language: "en-US",
    instances: [{
            adjustedStart: "0:05:15.782",
            adjustedEnd: "0:05:16.249",
            start: "0:05:15.782",
            end: "0:05:16.249"
    },
    {
            adjustedStart: "0:04:54.761",
            adjustedEnd: "0:04:55.228",
            start: "0:04:54.761",
            end: "0:04:55.228"
    }]
}

Gezichten

Als gezichten aanwezig zijn, gebruikt Azure AI Video Indexer de Face-API op alle frames van de video om gezichten en beroemdheden te detecteren.

Name Beschrijving
id De id van het gezicht.
name De naam van het gezicht. Het kan een geïdentificeerde beroemdheid of een door de klant getrainde persoon zijn Unknown #0.
confidence Het vertrouwensniveau in gezichtsidentificatie.
description Een beschrijving van de beroemdheid.
thumbnailId De id van de miniatuur van het gezicht.
knownPersonId Als het een bekende persoon is, is de interne id.
referenceId Als het een Bing-beroemdheid is, is de Bing-id.
referenceType Momenteel alleen Bing.
title Als het een beroemdheid is, de titel van de persoon. Voorbeeld: Microsoft's CEO.
imageUrl Als het een beroemdheid is, is de afbeeldings-URL.
instances Exemplaren van waar het gezicht in het tijdsbereik werd weergegeven. Elk exemplaar heeft ook een thumbnailsIds waarde.
"faces": [{
    "id": 2002,
    "name": "Xam 007",
    "confidence": 0.93844,
    "description": null,
    "thumbnailId": "00000000-aee4-4be2-a4d5-d01817c07955",
    "knownPersonId": "8340004b-5cf5-4611-9cc4-3b13cca10634",
    "referenceId": null,
    "title": null,
    "imageUrl": null,
    "instances": [{
        "thumbnailsIds": ["00000000-9f68-4bb2-ab27-3b4d9f2d998e",
        "cef03f24-b0c7-4145-94d4-a84f81bb588c"],
        "adjustedStart": "00:00:07.2400000",
        "adjustedEnd": "00:00:45.6780000",
        "start": "00:00:07.2400000",
        "end": "00:00:45.6780000"
    },
    {
        "thumbnailsIds": ["00000000-51e5-4260-91a5-890fa05c68b0"],
        "adjustedStart": "00:10:23.9570000",
        "adjustedEnd": "00:10:39.2390000",
        "start": "00:10:23.9570000",
        "end": "00:10:39.2390000"
    }]
}]

labels

Name Beschrijving
id De id van het label.
name De naam van het label. Bijvoorbeeld: Computer of TV.
language De taal van de naam van het label (wanneer vertaald), in de vorm van een BCP-47-tekenreeks .
instances Een lijst met tijdsbereiken waarin dit label werd weergegeven. (Een label kan meerdere keren worden weergegeven.) Elk exemplaar heeft een betrouwbaarheidsveld.
"labels": [
    {
      "id": 0,
      "name": "person",
      "language": "en-US",
      "instances": [
        {
          "confidence": 1.0,
          "start": "00: 00: 00.0000000",
          "end": "00: 00: 25.6000000"
        },
        {
          "confidence": 1.0,
          "start": "00: 01: 33.8670000",
          "end": "00: 01: 39.2000000"
        }
      ]
    },
    {
      "name": "indoor",
      "language": "en-US",
      "id": 1,
      "instances": [
        {
          "confidence": 1.0,
          "start": "00: 00: 06.4000000",
          "end": "00: 00: 07.4670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 09.6000000",
          "end": "00: 00: 10.6670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 11.7330000",
          "end": "00: 00: 20.2670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 21.3330000",
          "end": "00: 00: 25.6000000"
        }
      ]
    }
  ] 

Scènes

Name Beschrijving
id De id van de scène.
instances Een lijst met tijdsbereiken voor deze scène. (Een scène kan slechts één exemplaar hebben.)
"scenes":[  
    {  
      "id":0,
      "instances":[  
          {  
            "start":"0:00:00",
            "end":"0:00:06.34",
            "duration":"0:00:06.34"
          }
      ]
    },
    {  
      "id":1,
      "instances":[  
          {  
            "start":"0:00:06.34",
            "end":"0:00:47.047",
            "duration":"0:00:40.707"
          }
      ]
    },

]

Shots

Name Beschrijving
id De id van de schot.
keyFrames Een lijst met sleutelframes in de opname. Elk heeft een id en een lijst met tijdsbereiken voor exemplaren. Elk sleutelframeexemplaren heeft een thumbnailId veld dat de miniatuur-id van het sleutelframe bevat.
instances Een lijst met tijdsbereiken voor deze opname. (Een opname kan slechts één exemplaar hebben.)
"shots":[  
    {  
      "id":0,
      "keyFrames":[  
          {  
            "id":0,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:00.209",
                  "end":"0:00:00.251",
                  "duration":"0:00:00.042"
                }
            ]
          },
          {  
            "id":1,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:04.755",
                  "end":"0:00:04.797",
                  "duration":"0:00:00.042"
                }
            ]
          }
      ],
      "instances":[  
          {  
            "start":"0:00:00",
            "end":"0:00:06.34",
            "duration":"0:00:06.34"
          }
      ]
    },

]

Merken

Azure AI Video Indexer detecteert bedrijfs- en productmerknamen in de spraak-naar-teksttranscriptie en/of video OCR. Deze informatie omvat geen visuele herkenning van merken of logodetectie.

Name Beschrijving
id De id van het merk.
name De naam van het merk.
referenceId Het achtervoegsel van de Wikipedia-URL van het merk. Is bijvoorbeeld Target_Corporation het achtervoegsel van https://en.wikipedia.org/wiki/Target_Corporation.
referenceUrl De Wikipedia-URL van het merk, indien aanwezig. Voorbeeld: https://en.wikipedia.org/wiki/Target_Corporation.
description De beschrijving van het merk.
tags Een lijst met vooraf gedefinieerde tags die aan dit merk zijn gekoppeld.
confidence De betrouwbaarheidswaarde van de merkdetector van Azure AI Video Indexer (0-1).
instances Een lijst met tijdsbereiken voor dit merk. Elk exemplaar heeft een brandType waarde, die aangeeft of dit merk wordt weergegeven in de transcriptie of in een OCR.
"brands": [
{
    "id": 0,
    "name": "MicrosoftExcel",
    "referenceId": "Microsoft_Excel",
    "referenceUrl": "http: //en.wikipedia.org/wiki/Microsoft_Excel",
    "referenceType": "Wiki",
    "description": "Microsoft Excel is a sprea..",
    "tags": [],
    "confidence": 0.975,
    "instances": [
    {
        "brandType": "Transcript",
        "start": "00: 00: 31.3000000",
        "end": "00: 00: 39.0600000"
    }
    ]
},
{
    "id": 1,
    "name": "Microsoft",
    "referenceId": "Microsoft",
    "referenceUrl": "http: //en.wikipedia.org/wiki/Microsoft",
    "description": "Microsoft Corporation is...",
    "tags": [
    "competitors",
    "technology"
    ],
    "confidence": 1.0,
    "instances": [
    {
        "brandType": "Transcript",
        "start": "00: 01: 44",
        "end": "00: 01: 45.3670000"
    },
    {
        "brandType": "Ocr",
        "start": "00: 01: 54",
        "end": "00: 02: 45.3670000"
    }
    ]
}
]

statistieken

Name Beschrijving
CorrespondenceCount Het aantal correspondenties in de video.
SpeakerWordCount Het aantal woorden per spreker.
SpeakerNumberOfFragments Het aantal fragmenten dat de spreker in een video heeft.
SpeakerLongestMonolog De langste monolog van de luidspreker. Als de spreker stilte in de monolog heeft, is deze opgenomen. Stilte aan het begin en het einde van de monolog wordt verwijderd.
SpeakerTalkToListenRatio De berekening is gebaseerd op de tijd die is besteed aan de monolog van de spreker (zonder de stilte ertussen) gedeeld door de totale tijd van de video. De tijd wordt afgerond op het derde decimaalteken.

audioEffects (preview)

Name Beschrijving
id De id van het audio-effect.
type Het type audio-effect.
name Het type audio-effect in de taal waarin de JSON is geïndexeerd.
instances Een lijst met tijdsbereiken waarin dit audio-effect werd weergegeven. Elk exemplaar heeft een betrouwbaarheidsveld.
start + end Het tijdsbereik in de oorspronkelijke video.
adjustedStart + adjustedEnd Tijdsbereik versus aangepast tijdsbereik.
audioEffects: [{
 {
        id: 0,
        type: "Laughter",
        name: "Laughter",
        instances: [{
                confidence: 0.8815,
                adjustedStart: "0:00:10.2",
                adjustedEnd: "0:00:11.2",
                start: "0:00:10.2",
                end: "0:00:11.2"
            }, {
                confidence: 0.8554,
                adjustedStart: "0:00:48.26",
                adjustedEnd: "0:00:49.56",
                start: "0:00:48.26",
                end: "0:00:49.56"
            }, {
                confidence: 0.8492,
                adjustedStart: "0:00:59.66",
                adjustedEnd: "0:01:00.66",
                start: "0:00:59.66",
                end: "0:01:00.66"
            }
        ]
    }
],

Gevoelens

Sentimenten worden geaggregeerd op hun sentimentType veld (Positive, Neutralof).Negative Bijvoorbeeld: 0-0.1, 0.1-0.2.

Name Beschrijving
id De id van het sentiment.
averageScore Het gemiddelde van alle scores van alle exemplaren van dat sentimenttype.
instances Een lijst met tijdsbereiken waarin dit gevoel werd weergegeven.
sentimentType Het type kan Positive, Neutralof Negative.
"sentiments": [
{
    "id": 0,
    "averageScore": 0.87,
    "sentimentType": "Positive",
    "instances": [
    {
        "start": "00:00:23",
        "end": "00:00:41"
    }
    ]
}, {
    "id": 1,
    "averageScore": 0.11,
    "sentimentType": "Positive",
    "instances": [
    {
        "start": "00:00:13",
        "end": "00:00:21"
    }
    ]
}
]

visualContentModeration

Het visualContentModeration transcript bevat tijdsbereiken die azure AI Video Indexer heeft gevonden om mogelijk inhoud voor volwassenen te hebben. Als visualContentModeration deze leeg is, is er geen inhoud voor volwassenen geïdentificeerd.

Video's die inhoud voor volwassenen of ongepaste inhoud bevatten, zijn mogelijk alleen beschikbaar voor privéweergave. Gebruikers kunnen een aanvraag indienen voor een menselijke beoordeling van de inhoud. In dat geval bevat het IsAdult kenmerk het resultaat van de menselijke beoordeling.

Name Beschrijving
id De id van de visualcon tentmodus ration.
adultScore De volwassen score (van con tentmodus ration).
racyScore De ongepaste score (van con tentmodus ration).
instances Een lijst met tijdsbereiken waarin deze visuele con tentmodus ration werd weergegeven.

Meer informatie over visualContentModeration

"visualContentModeration": [
{
    "id": 0,
    "adultScore": 0.00069,
    "racyScore": 0.91129,
    "instances": [
    {
        "start": "00:00:25.4840000",
        "end": "00:00:25.5260000"
    }
    ]
},
{
    "id": 1,
    "adultScore": 0.99231,
    "racyScore": 0.99912,
    "instances": [
    {
        "start": "00:00:35.5360000",
        "end": "00:00:35.5780000"
    }
    ]
}
] 

textualContentModeration

Name Beschrijving
id De id van de tekstuele con tentmodus ration.
bannedWordsCount Het aantal verboden woorden.
bannedWordsRatio De verhouding van verboden woorden tot het totale aantal woorden.
Meer informatie over textualContentModeration

emoties

Azure AI Video Indexer identificeert emoties op basis van spraak- en audiosignalen.

Name Beschrijving
id De id van de emotie.
type Het type geïdentificeerde emotie: Joy, Sadness, Angerof Fear.
instances Een lijst met tijdsbereiken waarin deze emotie werd weergegeven.
"emotions": [{
    "id": 0,
    "type": "Fear",
    "instances": [{
      "adjustedStart": "0:00:39.47",
      "adjustedEnd": "0:00:45.56",
      "start": "0:00:39.47",
      "end": "0:00:45.56"
    },
    {
      "adjustedStart": "0:07:19.57",
      "adjustedEnd": "0:07:23.25",
      "start": "0:07:19.57",
      "end": "0:07:23.25"
    }]
  },
  {
    "id": 1,
    "type": "Anger",
    "instances": [{
      "adjustedStart": "0:03:55.99",
      "adjustedEnd": "0:04:05.06",
      "start": "0:03:55.99",
      "end": "0:04:05.06"
    },
    {
      "adjustedStart": "0:04:56.5",
      "adjustedEnd": "0:05:04.35",
      "start": "0:04:56.5",
      "end": "0:05:04.35"
    }]
  },
  {
    "id": 2,
    "type": "Joy",
    "instances": [{
      "adjustedStart": "0:12:23.68",
      "adjustedEnd": "0:12:34.76",
      "start": "0:12:23.68",
      "end": "0:12:34.76"
    },
    {
      "adjustedStart": "0:12:46.73",
      "adjustedEnd": "0:12:52.8",
      "start": "0:12:46.73",
      "end": "0:12:52.8"
    },
    {
      "adjustedStart": "0:30:11.29",
      "adjustedEnd": "0:30:16.43",
      "start": "0:30:11.29",
      "end": "0:30:16.43"
    },
    {
      "adjustedStart": "0:41:37.23",
      "adjustedEnd": "0:41:39.85",
      "start": "0:41:37.23",
      "end": "0:41:39.85"
    }]
  },
  {
    "id": 3,
    "type": "Sad",
    "instances": [{
      "adjustedStart": "0:13:38.67",
      "adjustedEnd": "0:13:41.3",
      "start": "0:13:38.67",
      "end": "0:13:41.3"
    },
    {
      "adjustedStart": "0:28:08.88",
      "adjustedEnd": "0:28:18.16",
      "start": "0:28:08.88",
      "end": "0:28:18.16"
    }]
  }
],

Onderwerpen

Azure AI Video Indexer maakt een deductie van de belangrijkste onderwerpen uit transcripties. Indien mogelijk wordt de IPTC-taxonomie op het tweede niveau opgenomen.

Name Beschrijving
id De id van het onderwerp.
name De naam van het onderwerp. Voorbeeld: Pharmaceuticals.
referenceId Breadcrumbs die de hiërarchie van het onderwerp weerspiegelen. Voorbeeld: HEALTH AND WELLBEING/MEDICINE AND HEALTHCARE/PHARMACEUTICALS.
confidence De betrouwbaarheidsscore in het bereik 0-1. Hoger is betrouwbaarder.
language De taal die in het onderwerp wordt gebruikt.
iptcName De naam van de IPTC-mediacode, indien gedetecteerd.
instances Op dit moment indexeert Azure AI Video Indexer geen onderwerp met tijdsintervallen. De hele video wordt gebruikt als interval.
"topics": [{
    "id": 0,
    "name": "INTERNATIONAL RELATIONS",
    "referenceId": "POLITICS AND GOVERNMENT/FOREIGN POLICY/INTERNATIONAL RELATIONS",
    "referenceType": "VideoIndexer",
    "confidence": 1,
    "language": "en-US",
    "instances": [{
        "adjustedStart": "0:00:00",
        "adjustedEnd": "0:03:36.25",
        "start": "0:00:00",
        "end": "0:03:36.25"
    }]
}, {
    "id": 1,
    "name": "Politics and Government",
    "referenceType": "VideoIndexer",
    "iptcName": "Politics",
    "confidence": 0.9041,
    "language": "en-US",
    "instances": [{
        "adjustedStart": "0:00:00",
        "adjustedEnd": "0:03:36.25",
        "start": "0:00:00",
        "end": "0:03:36.25"
    }]
}]
. . .

luidsprekers

Name Beschrijving
id De id van de spreker.
name De naam van de spreker in de vorm van Speaker #<number>. Voorbeeld: Speaker #1.
instances Een lijst met tijdsbereiken waarin deze spreker werd weergegeven.
"speakers":[
{
  "id":1,
  "name":"Speaker #1",
  "instances":[
     {
    "adjustedStart":"0:00:10.21",
    "adjustedEnd":"0:00:12.81",
    "start":"0:00:10.21",
    "end":"0:00:12.81"
     }
  ]
},
{
  "id":2,
  "name":"Speaker #2",
  "instances":[
     {
    "adjustedStart":"0:00:12.81",
    "adjustedEnd":"0:00:17.03",
    "start":"0:00:12.81",
    "end":"0:00:17.03"
     }
  ]
},