Az Azure AI Video Indexer kimenetének vizsgálata

Fontos

Az Azure Media Services kivonási bejelentése miatt az Azure AI Video Indexer bejelenti az Azure AI Video Indexer funkcióinak módosításait. Az Azure Media Service (AMS) kivonásával kapcsolatos változásokért tekintse meg az Azure AI Video Indexer-fiókjának jelentését. Tekintse meg az AMS-kivonás előkészítése: VI frissítési és migrálási útmutatót.

Ha indexel egy videót, az Azure AI Video Indexer létrehozza a megadott videóelemzések részleteit tartalmazó JSON-tartalmat. Az elemzések átiratokat, optikai karakterfelismerési elemeket (OCR-eket), arcokat, témaköröket és hasonló részleteket tartalmaznak. Mindegyik elemzéstípus tartalmaz időtartományokat, amelyek megmutatják, hogy a megállapítás mikor jelenik meg a videóban.

További információ: Azure AI Video Indexer insights.

Az elemzések gyökérelemei

Név Leírás
accountId A lejátszási lista VI-fiókazonosítója.
id A lejátszási lista azonosítója.
name A lejátszási lista neve.
description A lejátszási lista leírása.
userName A lejátszási listát létrehozó felhasználó neve.
created A lejátszási lista létrehozási ideje.
privacyMode A lejátszási lista adatvédelmi módja (Private vagy Public).
state A lejátszási lista állapota (Uploaded, Processing, Processed, Failedvagy Quarantined).
isOwned Azt jelzi, hogy az aktuális felhasználó hozta-e létre a lejátszási listát.
isEditable Azt jelzi, hogy az aktuális felhasználó jogosult-e a lejátszási lista szerkesztésére.
isBase Azt jelzi, hogy a lejátszási lista egy alap lejátszási lista (videó) vagy más videókból (származtatott) készült lejátszási lista.
durationInSeconds A lejátszási lista teljes időtartama.
summarizedInsights Az előállított JSON-kimenet tartalmazza Insights és tartalmazza az SummarizedInsights elemeket. Azt javasoljuk, hogy használja Insights és ne használja SummarizedInsights (ami a visszamenőleges kompatibilitás érdekében jelen van).
videos A lejátszási listát összeállító videók listája.
Ha ez a lejátszási lista más (származtatott) videók időtartományaiból áll, a listán szereplő videók csak a belefoglalt időtartományokból származó adatokat tartalmazzák.
{
  ...
  "accountId": "00000000-0000-0000-0000-000000000000",
  "id": "abc3454321",
  "name": "My first video",
  "description": "I am trying VI",
  "userName": "Some name",
  "created": "2018/2/2 18:00:00.000",
  "privacyMode": "Private",
  "state": "Processed",
  "isOwned": true,
  "isEditable": false,
  "isBase": false,
  "durationInSeconds": 120, 
  "summarizedInsights" : null,
  "videos": [{ . . . }]
}

Tipp.

Az előállított JSON-kimenet tartalmazza Insights és tartalmazza az SummarizedInsights elemeket. Javasoljuk, hogy használja Insights és ne használja SummarizedInsights (ami a visszamenőleges kompatibilitás érdekében jelen van).

Az elemzések összegzése

Ez a szakasz az elemzések összegzését mutatja be.

Attribútum Leírás
name A videó neve. Például: Azure Monitor
id A videó azonosítója. Például: 63c6d532ff
privacyMode A lebontás az alábbi módok egyikével rendelkezhet: A Public videó a fiókjában mindenki számára látható, és bárki számára, aki rendelkezik a videóra mutató hivatkozással. A Private videó a fiókjában lévő összes felhasználó számára látható.
duration Az az idő, amikor megállapítás történt, másodpercben.
thumbnailVideoId Annak a videónak az azonosítója, amelyből a miniatűr készült.
thumbnailId A videó miniatűr-azonosítója. A tényleges miniatűr lekéréséhez hívja meg a Get-Thumbnailt , és adja át, thumbnailVideoId majd thumbnailId.
faces Nulla vagy több arcot tartalmaz. További információ: arcok.
keywords Nulla vagy több kulcsszót tartalmaz. További információkért tekintse meg a kulcsszavakat.
sentiments Nulla vagy több hangulatot tartalmaz. További információ: hangulatok.
audioEffects Nulla vagy több hangeffektust tartalmaz. További információ: audioEffects.
labels Nulla vagy több címkét tartalmaz. További információ: címkék.
brands Nulla vagy több márkát tartalmaz. További információkért lásd a márkákat.
statistics További információkért lásd a statisztikákat.
emotions Nulla vagy több érzelmet tartalmaz. További információkért lásd az érzelmeket.
topics Nulla vagy több témakört tartalmaz. További információkért tekintse meg a témaköröket.

Videók

Név Leírás
accountId A videó VI-fiókazonosítója.
id A videó azonosítója.
name A videó neve.
state A videó állapota (Uploaded, , ProcessingProcessed, Failedvagy Quarantined).
processingProgress Az előrehaladás a feldolgozás során. Például: 20%
failureCode A hibakód, ha a videó feldolgozása nem sikerült. Például: UnsupportedFileType
failureMessage A hibaüzenet, ha a videó feldolgozása sikertelen volt.
externalId A videó külső azonosítója (ha a felhasználó megad egyet).
externalUrl A videó külső URL-címe (ha a felhasználó megad egyet).
metadata A videó külső metaadatai (ha a felhasználó megad egyet).
isAdult Azt jelzi, hogy a videó manuálisan lett-e felülvizsgálva, és felnőtt videóként lett-e azonosítva.
insights Az insights objektum. További információkért lásd az elemzéseket.
thumbnailId A videó miniatűr-azonosítója. A tényleges miniatűr lekéréséhez hívja meg a Get-Thumbnailt , és adja át a videóazonosítót és a miniatűr-azonosítót.
publishedUrl A videó streameléséhez megadott URL-cím.
publishedUrlProxy A videó Apple-eszközökön való streameléséhez használható URL-cím.
viewToken Rövid élettartamú megtekintési jogkivonat a videó streameléshez.
sourceLanguage A videó forrásnyelve.
language A videó tényleges nyelve (fordítás).
indexingPreset A videó indexeléséhez használt beállítás.
streamingPreset A videó közzétételéhez használt beállítás.
linguisticModelId A videó átírásához használt átirat-testreszabási (CRIS) modell.
statistics További információkért lásd a statisztikákat.
{
    "videos": [{
        "accountId": "2cbbed36-1972-4506-9bc7-55367912df2d",
        "id": "142a356aa6",
        "state": "Processed",
        "privacyMode": "Private",
        "processingProgress": "100%",
        "failureCode": "General",
        "failureMessage": "",
        "externalId": null,
        "externalUrl": null,
        "metadata": null,
        "insights": {. . . },
        "thumbnailId": "89d7192c-1dab-4377-9872-473eac723845",
        "publishedUrl": "https://videvmediaservices.streaming.mediaservices.windows.net:443/d88a652d-334b-4a66-a294-3826402100cd/Xamarine.ism/manifest",
        "publishedProxyUrl": null,
        "viewToken": "Bearer=<token>",
        "sourceLanguage": "En-US",
        "language": "En-US",
        "indexingPreset": "Default",
        "linguisticModelId": "00000000-0000-0000-0000-000000000000"
    }],
}

insights

Minden megállapítás (például átiratsorok, arcok vagy márkák) egyedi elemek listáját tartalmazza (például face1, , face2). face3 Minden elem saját metaadatokkal és példányainak listájával rendelkezik, amelyek további metaadatokkal rendelkező időtartományok.

Előfordulhat, hogy egy arc rendelkezik azonosítóval, névvel, miniatűrrel, egyéb metaadatokkal és az időpéldányok listájával (például 00:00:05 – 00:00:10, és 00:01:00 - 00:02:3000:41:21 – 00:41:49). Minden időbeli példány további metaadatokkal rendelkezhet. A metaadatok tartalmazhatják például az arc téglalap koordinátáit (20,230,60,60).

Verzió A kód verziója
sourceLanguage A videó forrásnyelve (egy főnyelvet feltételezve) BCP-47 sztring formájában.
language Az elemzési nyelv (a forrásnyelvről lefordítva) BCP-47 sztring formájában.
transcript Az átirati megállapítás.
ocr Az OCR-megállapítás .
keywords A kulcsszavak megállapítás.
transcripts Lehet, hogy egy vagy több átiratot tartalmaz.
faces Az arcok betekintést.
labels A címkék elemzése.
shots A lövések betekintést.
brands A márkák megállapítás.
audioEffects Az audioEffects megállapítás.
sentiments A véleményelemzés .
visualContentModeration A visualContentModeration megállapítás.
textualContentModeration A textualContentModeration megállapítás.
emotions Az érzelmek megállapítás.
topics A témakörök elemzése.
speakers Az előadók betekintést nyújtanak.

Példa:

{
  "version": "0.9.0.0",
  "sourceLanguage": "en-US",
  "language": "es-ES",
  "transcript": ...,
  "ocr": ...,
  "keywords": ...,
  "faces": ...,
  "labels": ...,
  "shots": ...,
  "brands": ...,
  "audioEffects": ...,
  "sentiments": ...,
  "visualContentModeration": ...,
  "textualContentModeration": ...
}

Átirat

Név Leírás
id A sor azonosítója.
text Maga az átirat.
confidence Az átirat pontosságának megbízhatósági szintje.
speakerId A beszélő azonosítója.
language Az átirat nyelve. Az átiratok támogatására szolgál, ahol az egyes sorok nyelve eltérő lehet.
instances Azon időtartományok listája, ahol ez a sor megjelent. Ha a példány átiratban van, csak egy példánya van.

Példa:

"transcript":[
{
  "id":1,
  "text":"Well, good morning everyone and welcome to",
  "confidence":0.8839,
  "speakerId":1,
  "language":"en-US",
  "instances":[
     {
    "adjustedStart":"0:00:10.21",
    "adjustedEnd":"0:00:12.81",
    "start":"0:00:10.21",
    "end":"0:00:12.81"
     }
  ]
},
{
  "id":2,
  "text":"ignite 2016. Your mission at Microsoft is to empower every",
  "confidence":0.8944,
  "speakerId":2,
  "language":"en-US",
  "instances":[
     {
    "adjustedStart":"0:00:12.81",
    "adjustedEnd":"0:00:17.03",
    "start":"0:00:12.81",
    "end":"0:00:17.03"
     }
  ]
}

Ocr

Név Leírás
id Az OCR vonalazonosítója.
text Az OCR szövege.
confidence Az elismerés megbízhatósága.
language Az OCR nyelve.
instances Azoknak az időtartományoknak a listája, ahol ez az OCR megjelent. (Ugyanaz az OCR többször is megjelenhet.)
height Az OCR-téglalap magassága.
top A felső hely képpontban.
left A bal oldali hely képpontban.
width Az OCR-téglalap szélessége.
angle Az OCR-téglalap szöge a következőtől -180 a következőig 180: . Középérték 0 vízszintesen balra és jobbra. A felső-alsó 90 függőleges középérték. A jobbról balra vízszintes középérték 180 . Az alsó-felső -90 függőleges középérték. Az eszközök értéke 30 a bal felső saroktól a jobb alsó sarokig.
"ocr": [
    {
      "id": 0,
      "text": "LIVE FROM NEW YORK",
      "confidence": 675.971,
      "height": 35,
      "language": "en-US",
      "left": 31,
      "top": 97,
      "width": 400,
      "angle": 30,
      "instances": [
        {
          "start": "00:00:26",
          "end": "00:00:52"
        }
      ]
    }
  ],

kulcsszavak

Név Leírás
id A kulcsszó azonosítója.
text A kulcsszó szövege.
confidence A kulcsszó megbízhatóságának felismerése.
language A kulcsszó nyelve (lefordítva).
instances Azon időtartományok listája, ahol ez a kulcsszó megjelent. (Egy kulcsszó többször is megjelenhet.)
{
    id: 0,
    text: "technology",
    confidence: 1,
    language: "en-US",
    instances: [{
            adjustedStart: "0:05:15.782",
            adjustedEnd: "0:05:16.249",
            start: "0:05:15.782",
            end: "0:05:16.249"
    },
    {
            adjustedStart: "0:04:54.761",
            adjustedEnd: "0:04:55.228",
            start: "0:04:54.761",
            end: "0:04:55.228"
    }]
}

Arcok

Ha arcok vannak jelen, az Azure AI Video Indexer a Face API-t használja a videó összes képkockáján az arcok és hírességek észlelésére.

Név Leírás
id Az arc azonosítója.
name Az arc neve. Ez lehet Unknown #0egy azonosított híresség, vagy egy ügyfél által képzett személy.
confidence Az arcfelismerés megbízhatósági szintje.
description A híresség leírása.
thumbnailId Az arc miniatűrjének azonosítója.
knownPersonId Ha ismert személy, a belső azonosító.
referenceId Ha ez egy Bing híresség, a Bing-azonosító.
referenceType Jelenleg csak Bing.
title Ha ez egy híresség, a személy címe. Például: Microsoft's CEO
imageUrl Ha ez egy híresség, a kép URL-címe.
instances Azok a példányok, ahol az arc megjelent az időtartományban. Minden példánynak van értéke thumbnailsIds is.
"faces": [{
    "id": 2002,
    "name": "Xam 007",
    "confidence": 0.93844,
    "description": null,
    "thumbnailId": "00000000-aee4-4be2-a4d5-d01817c07955",
    "knownPersonId": "8340004b-5cf5-4611-9cc4-3b13cca10634",
    "referenceId": null,
    "title": null,
    "imageUrl": null,
    "instances": [{
        "thumbnailsIds": ["00000000-9f68-4bb2-ab27-3b4d9f2d998e",
        "cef03f24-b0c7-4145-94d4-a84f81bb588c"],
        "adjustedStart": "00:00:07.2400000",
        "adjustedEnd": "00:00:45.6780000",
        "start": "00:00:07.2400000",
        "end": "00:00:45.6780000"
    },
    {
        "thumbnailsIds": ["00000000-51e5-4260-91a5-890fa05c68b0"],
        "adjustedStart": "00:10:23.9570000",
        "adjustedEnd": "00:10:39.2390000",
        "start": "00:10:23.9570000",
        "end": "00:10:39.2390000"
    }]
}]

Címkék

Név Leírás
id A címke azonosítója.
name A címke neve. Például: Computer vagy TV.
language A címke nevének nyelve (lefordítva) BCP-47 sztring formájában.
instances Azon időtartományok listája, ahol ez a címke megjelent. (Egy címke többször is megjelenhet.) Minden példány rendelkezik megbízhatósági mezővel.
"labels": [
    {
      "id": 0,
      "name": "person",
      "language": "en-US",
      "instances": [
        {
          "confidence": 1.0,
          "start": "00: 00: 00.0000000",
          "end": "00: 00: 25.6000000"
        },
        {
          "confidence": 1.0,
          "start": "00: 01: 33.8670000",
          "end": "00: 01: 39.2000000"
        }
      ]
    },
    {
      "name": "indoor",
      "language": "en-US",
      "id": 1,
      "instances": [
        {
          "confidence": 1.0,
          "start": "00: 00: 06.4000000",
          "end": "00: 00: 07.4670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 09.6000000",
          "end": "00: 00: 10.6670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 11.7330000",
          "end": "00: 00: 20.2670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 21.3330000",
          "end": "00: 00: 25.6000000"
        }
      ]
    }
  ] 

Jelenetek

Név Leírás
id A jelenet azonosítója.
instances A jelenethez tartozó időtartományok listája. (Egy jelenetnek csak egy példánya lehet.)
"scenes":[  
    {  
      "id":0,
      "instances":[  
          {  
            "start":"0:00:00",
            "end":"0:00:06.34",
            "duration":"0:00:06.34"
          }
      ]
    },
    {  
      "id":1,
      "instances":[  
          {  
            "start":"0:00:06.34",
            "end":"0:00:47.047",
            "duration":"0:00:40.707"
          }
      ]
    },

]

Lövések

Név Leírás
id A lövés azonosítója.
keyFrames A felvételen belüli kulcskeretek listája. Mindegyik rendelkezik azonosítóval és a példányok időtartományainak listájával. Minden kulcskeretpéldány rendelkezik egy thumbnailId mezővel, amely a kulcskeret miniatűr-azonosítóját tartalmazza.
instances A felvételhez tartozó időtartományok listája. (Egy lövésnek csak egy példánya lehet.)
"shots":[  
    {  
      "id":0,
      "keyFrames":[  
          {  
            "id":0,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:00.209",
                  "end":"0:00:00.251",
                  "duration":"0:00:00.042"
                }
            ]
          },
          {  
            "id":1,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:04.755",
                  "end":"0:00:04.797",
                  "duration":"0:00:00.042"
                }
            ]
          }
      ],
      "instances":[  
          {  
            "start":"0:00:00",
            "end":"0:00:06.34",
            "duration":"0:00:06.34"
          }
      ]
    },

]

Márkák

Az Azure AI Video Indexer észleli az üzleti és termékmárkák nevét a beszéd-szöveg átiratban és/vagy a video ocR-ben. Ezek az információk nem tartalmazzák a márkák vizuális felismerését vagy az emblémák észlelését.

Név Leírás
id A márka azonosítója.
name A márka neve.
referenceId A márka Wikipedia URL-címének utótagja. Az utótag https://en.wikipedia.org/wiki/Target_Corporationpéldául Target_Corporation a következő: .
referenceUrl A márka Wikipedia URL-címe, ha van ilyen. Például: https://en.wikipedia.org/wiki/Target_Corporation
description A márka leírása.
tags A márkához társított előre definiált címkék listája.
confidence Az Azure AI Video Indexer márkaérzékelőjének megbízhatósági értéke (0-1).
instances A márka időtartományainak listája. Minden példánynak van egy brandType értéke, amely azt jelzi, hogy ez a márka megjelent-e az átiratban vagy egy OCR-ben.
"brands": [
{
    "id": 0,
    "name": "MicrosoftExcel",
    "referenceId": "Microsoft_Excel",
    "referenceUrl": "http: //en.wikipedia.org/wiki/Microsoft_Excel",
    "referenceType": "Wiki",
    "description": "Microsoft Excel is a sprea..",
    "tags": [],
    "confidence": 0.975,
    "instances": [
    {
        "brandType": "Transcript",
        "start": "00: 00: 31.3000000",
        "end": "00: 00: 39.0600000"
    }
    ]
},
{
    "id": 1,
    "name": "Microsoft",
    "referenceId": "Microsoft",
    "referenceUrl": "http: //en.wikipedia.org/wiki/Microsoft",
    "description": "Microsoft Corporation is...",
    "tags": [
    "competitors",
    "technology"
    ],
    "confidence": 1.0,
    "instances": [
    {
        "brandType": "Transcript",
        "start": "00: 01: 44",
        "end": "00: 01: 45.3670000"
    },
    {
        "brandType": "Ocr",
        "start": "00: 01: 54",
        "end": "00: 02: 45.3670000"
    }
    ]
}
]

statisztika

Név Leírás
CorrespondenceCount A videóban szereplő levelezések száma.
SpeakerWordCount A szavak száma beszélőnként.
SpeakerNumberOfFragments A beszélő által a videóban található töredékek száma.
SpeakerLongestMonolog A beszélő leghosszabb monológja. Ha a hangszórón belül csend van a monológban, az is benne van. A monolog elején és végén lévő csend el lesz távolítva.
SpeakerTalkToListenRatio A számítás alapja a beszélő monológján eltöltött idő (a hallgatás nélkül) és a videó teljes ideje. Az idő a harmadik tizedesvesszőre van kerekítve.

audioEffects (előzetes verzió)

Név Leírás
id A hangeffektus azonosítója.
type A hangeffektus típusa.
name A hangeffektus típusa abban a nyelven, amelyben a JSON indexelt.
instances Azoknak az időtartományoknak a listája, ahol ez a hangeffektus megjelent. Minden példány rendelkezik megbízhatósági mezővel.
start + end Az eredeti videó időtartománya.
adjustedStart + adjustedEnd Időtartomány és korrigált időtartomány.
audioEffects: [{
 {
        id: 0,
        type: "Laughter",
        name: "Laughter",
        instances: [{
                confidence: 0.8815,
                adjustedStart: "0:00:10.2",
                adjustedEnd: "0:00:11.2",
                start: "0:00:10.2",
                end: "0:00:11.2"
            }, {
                confidence: 0.8554,
                adjustedStart: "0:00:48.26",
                adjustedEnd: "0:00:49.56",
                start: "0:00:48.26",
                end: "0:00:49.56"
            }, {
                confidence: 0.8492,
                adjustedStart: "0:00:59.66",
                adjustedEnd: "0:01:00.66",
                start: "0:00:59.66",
                end: "0:01:00.66"
            }
        ]
    }
],

Érzelmeket

A hangulatok a mezőjük sentimentType (PositiveNeutralvagy Negative) alapján lesznek összesítve. Például: 0-0.1, 0.1-0.2.

Név Leírás
id A hangulat azonosítója.
averageScore Az adott hangulattípus összes példányának összes pontszámának átlaga.
instances Azoknak az időtartományoknak a listája, ahol ez a hangulat megjelent.
sentimentType A típus lehet Positive, Neutralvagy Negative.
"sentiments": [
{
    "id": 0,
    "averageScore": 0.87,
    "sentimentType": "Positive",
    "instances": [
    {
        "start": "00:00:23",
        "end": "00:00:41"
    }
    ]
}, {
    "id": 1,
    "averageScore": 0.11,
    "sentimentType": "Positive",
    "instances": [
    {
        "start": "00:00:13",
        "end": "00:00:21"
    }
    ]
}
]

visualContentModeration

Az visualContentModeration átirat olyan időtartományokat tartalmaz, amelyekről az Azure AI Video Indexer úgy találta, hogy felnőtt tartalommal rendelkezik. Ha visualContentModeration üres, a felnőtt tartalom nem lett azonosítva.

Előfordulhat, hogy a felnőtt vagy a racy tartalmat tartalmazó videók csak privát megtekintésre érhetők el. A felhasználók kérelmet küldhetnek a tartalom emberi felülvizsgálatára. Ebben az esetben az IsAdult attribútum az emberi felülvizsgálat eredményét tartalmazza.

Név Leírás
id A vizualizáció sátormód ráció azonosítója.
adultScore A felnőtt pontszám (a con sátormód ration).
racyScore A racy score (a con sátormód ration).
instances Azon időtartományok listája, ahol ez a vizualizáció sátormód ráció megjelent.

További információ a visualContentModeration-ről

"visualContentModeration": [
{
    "id": 0,
    "adultScore": 0.00069,
    "racyScore": 0.91129,
    "instances": [
    {
        "start": "00:00:25.4840000",
        "end": "00:00:25.5260000"
    }
    ]
},
{
    "id": 1,
    "adultScore": 0.99231,
    "racyScore": 0.99912,
    "instances": [
    {
        "start": "00:00:35.5360000",
        "end": "00:00:35.5780000"
    }
    ]
}
] 

textualContentModeration

Név Leírás
id A szöveges con sátormód ration azonosítója.
bannedWordsCount A tiltott szavak száma.
bannedWordsRatio A tiltott szavak és a szavak teljes számának aránya.
További információ a textualContentModeration-ről

Érzelmek

Az Azure AI Video Indexer beszéd- és hangjelzések alapján azonosítja az érzelmeket.

Név Leírás
id Az érzelem azonosítója.
type Egy azonosított érzelem típusa: Joy, Sadness, Angervagy Fear.
instances Azoknak az időtartományoknak a listája, ahol ez az érzelem megjelent.
"emotions": [{
    "id": 0,
    "type": "Fear",
    "instances": [{
      "adjustedStart": "0:00:39.47",
      "adjustedEnd": "0:00:45.56",
      "start": "0:00:39.47",
      "end": "0:00:45.56"
    },
    {
      "adjustedStart": "0:07:19.57",
      "adjustedEnd": "0:07:23.25",
      "start": "0:07:19.57",
      "end": "0:07:23.25"
    }]
  },
  {
    "id": 1,
    "type": "Anger",
    "instances": [{
      "adjustedStart": "0:03:55.99",
      "adjustedEnd": "0:04:05.06",
      "start": "0:03:55.99",
      "end": "0:04:05.06"
    },
    {
      "adjustedStart": "0:04:56.5",
      "adjustedEnd": "0:05:04.35",
      "start": "0:04:56.5",
      "end": "0:05:04.35"
    }]
  },
  {
    "id": 2,
    "type": "Joy",
    "instances": [{
      "adjustedStart": "0:12:23.68",
      "adjustedEnd": "0:12:34.76",
      "start": "0:12:23.68",
      "end": "0:12:34.76"
    },
    {
      "adjustedStart": "0:12:46.73",
      "adjustedEnd": "0:12:52.8",
      "start": "0:12:46.73",
      "end": "0:12:52.8"
    },
    {
      "adjustedStart": "0:30:11.29",
      "adjustedEnd": "0:30:16.43",
      "start": "0:30:11.29",
      "end": "0:30:16.43"
    },
    {
      "adjustedStart": "0:41:37.23",
      "adjustedEnd": "0:41:39.85",
      "start": "0:41:37.23",
      "end": "0:41:39.85"
    }]
  },
  {
    "id": 3,
    "type": "Sad",
    "instances": [{
      "adjustedStart": "0:13:38.67",
      "adjustedEnd": "0:13:41.3",
      "start": "0:13:38.67",
      "end": "0:13:41.3"
    },
    {
      "adjustedStart": "0:28:08.88",
      "adjustedEnd": "0:28:18.16",
      "start": "0:28:08.88",
      "end": "0:28:18.16"
    }]
  }
],

Témák

Az Azure AI Video Indexer az átiratok fő témaköreinek következtetését teszi lehetővé. Ha lehetséges, a rendszer a második szintű IPTC-osztályozást is tartalmazza.

Név Leírás
id A témakör azonosítója.
name A témakör neve. Például: Pharmaceuticals
referenceId A témakör hierarchiáját tükröző szélességek. Például: HEALTH AND WELLBEING/MEDICINE AND HEALTHCARE/PHARMACEUTICALS
confidence A tartomány 0-1megbízhatósági pontszáma . A magasabb magabiztosabb.
language A témakörben használt nyelv.
iptcName Az IPTC-médiakód neve, ha észlelhető.
instances Az Azure AI Video Indexer jelenleg nem indexel egy témakört időintervallumokra. A rendszer az egész videót használja intervallumként.
"topics": [{
    "id": 0,
    "name": "INTERNATIONAL RELATIONS",
    "referenceId": "POLITICS AND GOVERNMENT/FOREIGN POLICY/INTERNATIONAL RELATIONS",
    "referenceType": "VideoIndexer",
    "confidence": 1,
    "language": "en-US",
    "instances": [{
        "adjustedStart": "0:00:00",
        "adjustedEnd": "0:03:36.25",
        "start": "0:00:00",
        "end": "0:03:36.25"
    }]
}, {
    "id": 1,
    "name": "Politics and Government",
    "referenceType": "VideoIndexer",
    "iptcName": "Politics",
    "confidence": 0.9041,
    "language": "en-US",
    "instances": [{
        "adjustedStart": "0:00:00",
        "adjustedEnd": "0:03:36.25",
        "start": "0:00:00",
        "end": "0:03:36.25"
    }]
}]
. . .

Hangszórók

Név Leírás
id A beszélő azonosítója.
name A beszélő neve a következő formában Speaker #<number>: . Például: Speaker #1
instances Azoknak az időtartományoknak a listája, ahol ez a beszélő megjelent.
"speakers":[
{
  "id":1,
  "name":"Speaker #1",
  "instances":[
     {
    "adjustedStart":"0:00:10.21",
    "adjustedEnd":"0:00:12.81",
    "start":"0:00:10.21",
    "end":"0:00:12.81"
     }
  ]
},
{
  "id":2,
  "name":"Speaker #2",
  "instances":[
     {
    "adjustedStart":"0:00:12.81",
    "adjustedEnd":"0:00:17.03",
    "start":"0:00:12.81",
    "end":"0:00:17.03"
     }
  ]
},