다음을 통해 공유


비디오 번역이란?

동영상 번역은 자동으로 여러 언어로 동영상을 원활하게 번역하고 생성할 수 있는 Azure AI 음성 기능입니다. 이 기능은 전 세계 다양한 시청자에게 맞게 비디오 콘텐츠를 지역화하는 데 도움을 주기 위해 설계되었습니다. 브이로그, 교육, 뉴스, 기업 교육, 광고, 영화, TV 프로그램 등과 같은 다양한 사용 사례에서 몰입형의 지역화된 비디오를 효율적으로 만들 수 있습니다.

비디오의 원래 언어를 다른 언어로 녹음된 음성으로 바꾸는 프로세스는 다양한 대상을 수용하는 데 필수적입니다. 일반적으로 사용자 녹화 및 수동 포스트 프로덕션을 통해 달성되는 이 방법은 시청자가 모국어로 비디오 콘텐츠를 즐길 수 있도록 합니다. 그러나 다음과 같은 주요 문제가 있습니다.

  • 높은 비용: 기존의 비디오 번역 방법에는 종종 비용이 많이 드는 인간 성우와 광범위한 포스트 프로덕션 작업이 필요하므로 콘텐츠 제작자에게 비용이 많이 듭니다.
  • 시간이 많이 소요됨: 번역된 음성을 녹음 및 편집하는 수동 프로세스에는 상당한 시간이 소요되어 지역화된 콘텐츠의 릴리스가 지연될 수 있습니다.
  • 일관성 없는 품질: 인간 성우가 항상 원래 화자의 음성을 정확하게 복제하지 않을 수 있으므로 시청자에게 몰입감이 떨어집니다.

Azure AI Speech에서 비디오 번역을 사용하면 이러한 문제를 효과적으로 해결할 수 있습니다. 이 기능은 번역 프로세스를 자동화하여 비용 및 프로덕션 시간을 크게 줄이면서 고품질 결과를 보장합니다. 원래 스피커의 음성을 정확하게 복제하면 전 세계 시청자에게 원활하고 몰입형 보기 환경을 만들 수 있습니다.

  • 비용 효율적: 비용이 많이 드는 인간 성우 및 수동 포스트 프로덕션 작업의 필요성을 줄입니다.
  • 시간 효율적: 지역화된 비디오를 제작하는 데 필요한 시간을 크게 단축합니다.
  • 고품질: 원래 스피커의 음성을 정확하게 복제하여 원활하고 몰입형 보기 환경을 보장합니다.
  • 확장 가능: 대량의 지역화된 콘텐츠를 빠르고 효율적으로 제작할 수 있습니다.

사용 사례

Azure AI 음성에서 제공하는 동영상 번역은 다양한 업계 및 콘텐츠 형식에 걸쳐 광범위한 사용 사례를 가지고 있습니다. 다음은 몇 가지 주요 적용 사례입니다.

  • 뉴스 및 인터뷰: 언론사는 뉴스와 인터뷰를 번역하고 더빙하여 전 세계 시청자에게 정확하고 시의적절한 정보를 제공할 수 있습니다.

  • 광고 및 마케팅: 기업은 광고 및 마케팅 비디오를 지역화하여 다양한 지역/국가에 있는 대상 고객의 관심을 끌 수 있으며 브랜드 인지도와 고객 참여도를 높일 수 있습니다.

  • 교육 및 학습: 교육 기관 및 인터넷 학습 플랫폼은 교육 비디오 및 강의를 다른 언어로 더빙하여 학습 접근성과 포용성을 향상할 수 있습니다.

  • 영화 및 TV 프로그램: 영화 스튜디오와 제작사는 해외 배급을 위해 영화와 TV 프로그램을 더빙하여 더 많은 시청자에게 다가가고 수익 잠재력을 극대화할 수 있습니다.

  • 브이로그 및 숏폼 비디오: 콘텐츠 크리에이터는 브이로그와 숏폼 비디오를 쉽게 번역하고 더빙하여 전 세계 시청자에게 다가가 시청률과 참여도를 높일 수 있습니다.

  • 기업 교육: 기업은 다양한 지역의 직원을 위해 교육 비디오를 지역화하여 전체 직원 간에 일관되고 효과적인 커뮤니케이션을 보장할 수 있습니다.

핵심 기능

  • 대화 오디오 추출 및 음성 콘텐츠 대화 내용 기록.

    원본 비디오에서 대화 오디오를 자동으로 추출하고 음성 콘텐츠를 기록합니다.

  • A 언어에서 B 언어로의 번역 및 LLM(대규모 언어 모델) 재구성.

    고급 언어 처리 기술을 사용하여 텍스트로 기록된 콘텐츠를 원래 언어(A 언어)에서 대상 언어(B 언어)로 번역합니다. LLM 재구성을 통해 번역 품질을 높이고 성별 인식 번역 텍스트를 구체화합니다.

  • 자동 번역 - 다른 언어로 음성 생성.

    AI 기반 텍스트 음성 변환 기술을 활용하여 대상 언어로 인간의 목소리와 유사한 음성을 자동으로 생성합니다. 이러한 음성은 비디오와 정확하게 동기화되어 흠 없는 번역을 보장합니다. 여기에는 고품질 출력을 위해 표준 음성을 활용하고 개인 음성에 대한 옵션을 제공하는 것이 포함됩니다.

  • HITL(인간 개입)을 통한 콘텐츠 편집.

    사람이 개입해 번역된 콘텐츠를 검토하고 편집하여 더빙된 동영상을 최종 완성하기 전에 정확성과 문화적 적합성을 보장할 수 있습니다.

  • 자막 생성.

    번역된 대화, 동기화된 자막, 생성된 음성이 포함된 완전히 더빙된 비디오를 제공합니다. 비디오는 다운로드하고 다양한 플랫폼에 배포할 수 있습니다. 최적으로 표시되도록 각 화면의 자막 길이를 설정할 수도 있습니다.

작동 방식

이 다이어그램은 워크플로에 대한 개략적인 개요를 제공합니다.

비디오 번역 API 워크플로의 다이어그램.

  1. Azure Blob Storage로 번역하려는 비디오 파일을 업로드합니다.
  2. 비디오 파일의 URL을 지정하여 번역을 만듭니다. 원본 및 대상 언어, 음성 유형 및 자막을 비디오에 구울지 여부와 같은 다른 매개 변수를 포함합니다.

    참고

    번역을 만들면 번역 프로세스가 시작되지 않습니다.

  3. 반복을 만들어 비디오 번역을 시작할 수 있습니다. 반복은 번역 프로세스의 특정 인스턴스입니다. 동일한 번역에 대해 여러 반복을 만들 수 있으므로 다른 설정 또는 매개 변수를 실험할 수 있습니다.
  4. 첫 번째 반복 후에는 후속 반복에서 자막 파일을 사용할 수 있습니다. 사용자 고유의 자막 파일을 업로드하거나 자동 생성된 자막 파일을 변경하고 수정된 자막 파일을 업로드합니다.
  5. 번역 및 반복의 상태를 주기적으로 가져옵니다. 상태는 번역이 진행 중인지, 완료되었는지 또는 실패했는지를 나타냅니다.
  6. 번역이 완료되면 번역된 비디오 및 자막을 다운로드할 수 있습니다. 번역된 비디오는 원래 음성을 번역된 음성으로 대체하고 자막은 번역된 음성과 동기화됩니다.
  7. 더 이상 필요하지 않은 경우 번역 및 반복을 삭제할 수도 있습니다. 번역을 삭제하면 연결된 모든 반복 및 데이터가 제거됩니다.

지원되는 지역 및 언어

현재 Azure AI 음성의 동영상 번역은 미국 동부 지역에서만 지원됩니다.

다양한 언어 간의 동영상 번역을 지원하므로 사용자의 콘텐츠를 특정 언어 선호도에 맞게 조정할 수 있습니다. 동영상 번역이 지원되는 언어는 지원되는 원본 및 대상 언어를 참조하세요.

가격 책정

동영상 번역에 대한 가격 책정 세부 정보는 음성 서비스 가격 책정을 참조하세요. 비디오 번역 가격은 기능을 사용할 수 있는 서비스 지역에 만 표시됩니다.