다음을 통해 공유


토픽 유추 인사이트 가져오기

토픽 유추

토픽 유추는 기록된 오디오에서 파생된 유추된 인사이트, 시각적 텍스트의 OCR 콘텐츠 및 Video Indexer 얼굴 인식 모델을 사용하여 비디오에서 인식된 유명인을 만듭니다.

웹 포털에서 추출된 토픽 및 범주(사용 가능한 경우)가 인사이트 탭에 나열됩니다. 미디어 파일의 토픽으로 이동하려면 토픽 -> 이전 재생 또는 다음 재생을 선택합니다.

항목 유추 사용 사례

  • 고객 관심사와 일치하는 토픽 유추를 사용하여 개인 맞춤(예: 영국 영화 또는 축제에 대한 프로모션을 게시하는 영국 관련 웹 사이트)
  • 특정 토픽에 대한 인사이트를 심층 검색하여 회사, 가상 사용자 또는 기술(예: 뉴스 에이전시)에 대한 기능 스토리를 만듭니다.
  • 수익 창출, 추출된 인사이트의 가치 향상. 예를 들어 광고 수익에 의존하는 산업(예: 뉴스 또는 소셜 미디어)은 추출된 인사이트를 광고 서버에 대한 추가 신호로 사용하여 관련 광고를 제공할 수 있습니다.

웹 포털을 사용하여 인사이트 JSON 보기

비디오를 업로드하고 인덱싱한 후에는 웹 포털을 사용하여 JSON 형식으로 인사이트를 다운로드할 수 있습니다.

  1. 라이브러리 탭을 선택합니다.
  2. 작업할 미디어를 선택합니다.
  3. 다운로드 및 인사이트(JSON)를 선택합니다. JSON 파일이 새 브라우저 탭에서 열립니다.
  4. 예제 응답에 설명된 키 쌍을 찾습니다.

API 사용

  1. 비디오 인덱스 가져오기 요청을 사용합니다. 을 전달하는 &includeSummarizedInsights=false것이 좋습니다.
  2. 예제 응답에 설명된 키 쌍을 찾습니다.

예제 응답

    "topics": [
      {
        "id": 1,
        "name": "Pens",
        "referenceId": "Category:Pens",
        "referenceUrl": "https://en.wikipedia.org/wiki/Category:Pens",
        "referenceType": "Wikipedia",
        "confidence": 0.6833,
        "iabName": null,
        "language": "en-US",
        "instances": [
          {
            "adjustedStart": "0:00:30",
            "adjustedEnd": "0:01:17.5",
            "start": "0:00:30",
            "end": "0:01:17.5"
          }
        ]
      },
      {
        "id": 2,
        "name": "Musical groups",
        "referenceId": "Category:Musical_groups",
        "referenceUrl": "https://en.wikipedia.org/wiki/Category:Musical_groups",
        "referenceType": "Wikipedia",
        "confidence": 0.6812,
        "iabName": null,
        "language": "en-US",
        "instances": [
          {
            "adjustedStart": "0:01:10",
            "adjustedEnd": "0:01:17.5",
            "start": "0:01:10",
            "end": "0:01:17.5"
          }
        ]
      },

Important

모든 VI 기능에 대한 투명도 참고 개요를 읽는 것이 중요합니다. 각 인사이트에는 자체의 투명성 메모도 있습니다.

항목 유추 참고 사항

  • 파일을 업로드할 때 항상 고품질의 비디오 콘텐츠를 사용합니다. 권장되는 최대 프레임 크기는 HD이고 프레임 속도는 30FPS입니다. 프레임에는 10명 이하가 포함되어야 합니다. 비디오에서 AI 모델로 프레임을 출력하는 경우 초당 약 2~3개의 프레임만 보냅니다. 10개 이상의 프레임을 처리하면 AI 결과가 지연될 수 있습니다.
  • 파일을 업로드할 때 항상 고품질 오디오 및 비디오 콘텐츠를 사용합니다. 분석을 수행하려면 1분 이상의 자발적인 대화형 음성이 필요합니다. 오디오 효과는 비스피치 세그먼트에서만 검색됩니다. 비스피치 섹션의 최소 기간은 2초입니다. 음성 명령 및 노래는 지원되지 않습니다.
  • 일반적으로 200픽셀 미만의 작은 사람 또는 개체와 앉은 사람은 감지되지 않을 수 있습니다. 비슷한 옷이나 유니폼을 입은 사람은 같은 사람으로 감지될 수 있으며 동일한 ID 번호가 제공됩니다. 방해가 되는 사람 또는 개체는 검색되지 않을 수 있습니다. 앞뒤 포즈가 있는 사람들의 트랙은 다른 인스턴스로 분할될 수 있습니다.

항목 유추 구성 요소

구성 요소 정의
원본 언어 사용자는 인덱싱을 위해 원본 파일을 업로드합니다.
전처리 전사, OCR 및 얼굴 인식 AIS는 미디어 파일에서 인사이트를 추출합니다.
인사이트 처리 토픽 AI는 전처리 중에 추출된 전사, OCR 및 얼굴 인식 인사이트를 분석합니다.
- 전사된 텍스트, 전사된 텍스트 인사이트의 각 줄은 온톨로지 기반 AI 기술을 사용하여 검사됩니다.
- OCR 및 얼굴 인식 인사이트는 온톨로지 기반의 AI 기술을 사용하여 함께 검사됩니다.
후처리 - 전사된 텍스트, 인사이트는 추출되어 전사된 텍스트의 줄 번호와 함께 토픽 범주에 연결됩니다. 예를 들어 7줄의 정치입니다.
- OCR 및 얼굴 인식, 각 인사이트는 미디어 파일에서 토픽 인스턴스의 시간과 함께 토픽 범주에 연결됩니다. 예를 들어 20.00의 인물 및 음악 범주의 Freddie Mercury입니다.
신뢰도 값 각 토픽의 예상 신뢰 수준은 0~1의 범위로 계산됩니다. 신뢰도 점수는 결과의 정확도에 대한 확실성을 나타냅니다. 예를 들어 82% 확실성은 0.82 점수로 표시됩니다.

샘플 코드

VI에 대한 모든 샘플 보기