다음을 통해 공유


명명된 엔터티 추출 인사이트 가져오기

명명된 엔터티 추출

명명된 엔터티 추출은 NLP(자연어 처리)를 사용하여 미디어 파일의 오디오 및 이미지에 표시되는 위치, 사람 및 브랜드에 대한 인사이트를 추출합니다. 명명된 엔터티 추출 인사이트는 전사 및 OCR(광학 문자 인식)을 사용합니다.

명명된 엔터티 사용 사례

  • 상황에 맞는 광고를 게재할 수 있습니다. 예를 들어, 이탈리아 영상에 이어 피자 체인 광고를 게재할 수 있습니다.
  • 뉴스 특집 기사를 만들기 위해 미디어 아카이브를 딥 서치하여 사람 또는 위치에 대한 인사이트를 얻을 수 있습니다.
  • 시각 장애인의 접근성 향상을 위해 OCR 처리를 통한 영상용 구두 설명을 만들 수 있습니다. 예를 들어, 영화의 배경 스토리텔러를 만들 수 있습니다.
  • 브랜드 이름에 대한 인사이트 추출

웹 포털을 사용하여 인사이트 JSON 보기

비디오를 업로드하고 인덱싱한 후에는 웹 포털을 사용하여 JSON 형식으로 인사이트를 다운로드할 수 있습니다.

  1. 라이브러리 탭을 선택합니다.
  2. 작업할 미디어를 선택합니다.
  3. 다운로드 및 인사이트(JSON)를 선택합니다. JSON 파일이 새 브라우저 탭에서 열립니다.
  4. 예제 응답에 설명된 키 쌍을 찾습니다.

API 사용

  1. 비디오 인덱스 가져오기 요청을 사용합니다. 을 전달하는 &includeSummarizedInsights=false것이 좋습니다.
  2. 예제 응답에 설명된 키 쌍을 찾습니다.

예제 응답

    namedPeople: [
    {
    referenceId: "Satya_Nadella",
    referenceUrl: "https://en.wikipedia.org/wiki/Satya_Nadella",
    confidence: 1,
    description: "CEO of Microsoft Corporation",
    seenDuration: 33.2,
    id: 2,
    name: "Satya Nadella",
    appearances: [
    {
    startTime: "0:01:11.04",
    endTime: "0:01:17.36",
    startSeconds: 71,
    endSeconds: 77.4
    },
    {
    startTime: "0:01:31.83",
    endTime: "0:01:37.1303666",
    startSeconds: 91.8,
    endSeconds: 97.1
    },

Important

모든 VI 기능에 대한 투명도 참고 개요를 읽는 것이 중요합니다. 각 인사이트에는 자체의 투명성 메모도 있습니다.

명명된 엔터티 노트

  • 결과의 정확도를 신중하게 고려하세요. 보다 정확한 검색을 위해 오디오와 이미지의 품질을 확인하세요. 낮은 품질의 오디오 및 이미지는 검색된 인사이트에 영향을 줄 수 있습니다.
  • 명명된 엔터티는 오디오와 이미지에서만 인사이트를 검색합니다. 브랜드 이름의 로고가 검색되지 않을 수 있습니다.
  • 법 집행 용도로 명명된 엔티티를 사용할 땐 항상 오디오의 일부를 감지하지 못할 수 있다는 점을 신중하게 고려하세요. 공정하고 고품질의 의사 결정을 보장하려면 항상 명명된 엔터티를 인간의 감독과 결합합니다.
  • 개인 및 그룹에 심각한 부정적인 영향을 미칠 수 있는 의사 결정에 명명된 엔터티를 사용하지 마세요. 텍스트를 추출하는 기계 학습 모델은 감지되지 않거나 잘못된 텍스트를 출력할 수 있습니다. 잘못된 출력을 기반으로 한 결정은 피해야 하는 심각한 부정적인 영향을 미칠 수 있습니다. 개인에게 심각한 영향을 미칠 가능성이 있는 결정에 대한 인간의 검토를 항상 포함해야 합니다.

구성 요소

명명된 엔터티 추출 절차에서 미디어 파일은 다음과 같이 처리됩니다.

구성 요소 정의
원본 파일 사용자가 인덱싱을 위해 원본 파일을 업로드합니다.
텍스트 추출 - 음성 파일이 Speech Services API로 전송되어 전사를 추출합니다.
- 샘플링된 프레임이 Azure AI 비전 API로 전송되어 OCR을 추출합니다.
분석 그런 다음 인사이트가 Text Analytics API로 전송되어 엔터티를 추출합니다. 예를 들어 Microsoft, Paris 또는 Paul, Sarah 등의 사람 이름을 추출합니다.
처리 및 통합 그런 다음 결과가 처리됩니다. 해당하는 경우 Wikipedia 링크가 추가되고 Video Indexer의 사용자 지정 가능한 기본 제공 브랜딩 목록을 통해 브랜드가 식별됩니다.
신뢰도 값 명명된 각 엔터티의 예상 신뢰도 수준은 0~1 범위로 계산됩니다. 신뢰도 점수는 결과의 정확도에 대한 확실성을 나타냅니다. 예를 들어 82% 확실성은 0.82 점수로 표시됩니다.

샘플 코드

VI에 대한 모든 샘플 보기