Azure AI Video Indexer를 사용하여 언어 모델 사용자 지정

아티클
10/09/2024

Azure AI Video Indexer는 Microsoft Custom Speech Service와 통합을 통해 자동 음성 인식을 지원합니다. 적응 텍스트를 업로드하여 언어 모델을 사용자 지정할 수 있습니다. 이 텍스트는 엔진이 적응하는 데 사용할 어휘가 있는 도메인에서 가져온 것입니다. 모델을 학습하면 기본 발음을 가정하여 적응 텍스트에 나타나는 새 단어가 인식되고 언어 모델은 새로운 가능한 단어 시퀀스를 학습합니다. 지원되는 언어의 Azure AI Video Indexer 언어에서 지원되는 목록을 참조하세요.

예를 들어 Azure Kubernetes 서비스의 컨텍스트에서 "Kubernetes" 는 매우 구체적인 단어입니다. 해당 단어는 Azure AI Video Indexer에 처음 사용되므로 "커뮤니티"로 인식됩니다. 모델을 학습하여 "Kubernetes"로 인식합니다. 다른 경우에는 단어가 존재하지만 언어 모델은 특정 컨텍스트에 표시할 것으로 기대하지 않습니다. 예를 들어 "컨테이너 서비스" 는 지정되지 않은 언어 모델이 특정 단어 집합으로 인식하는 2단어 시퀀스가 아닙니다.

언어 모델을 사용자 지정하는 방법에는 다음 두 가지가 있습니다.

옵션 1: Azure AI Video Indexer에서 생성된 대본을 편집합니다. 대본을 편집하고 수정함으로써 향후 향상된 결과를 제공할 수 있도록 언어 모델을 학습시키는 것입니다.
옵션 2: 텍스트 파일을 업로드하여 언어 모델을 학습시킵니다. 파일에는 Video Indexer 대본에 표시하려는 단어 목록이나 문장과 단락에 자연스럽게 포함된 관련 단어가 포함될 수 있습니다. 후자의 접근 방식을 사용하면 더 나은 결과를 얻을 수 있으므로 업로드 파일에 콘텐츠와 관련된 전체 문장이나 단락을 포함하는 것이 좋습니다.

Important

의도한 영향을 무효화하므로 업로드 파일에 현재 잘못 전사된 단어 또는 문장(예: "커뮤니티")을 포함하지 마세요. 표시하려는 단어만 포함하세요(예: "Kubernetes").

사용자 지정 언어 모델 최적화

Azure AI Video Indexer는 단어 조합의 가능성을 기반으로 학습하므로 가장 잘 학습합니다.

문장을 말할 때 충분히 실제적인 문장의 예제를 제공하세요.
한 줄에 한 문장만 넣으세요. 그렇지 않으면 시스템이 문장 전체에서 가능성을 학습합니다.
한 단어를 문장으로 넣어 다른 단어보다 강조할 수 있지만, 시스템은 전체 문장에서 가장 잘 학습합니다.
새 단어나 약어를 도입할 때 가능하면 전체 문장에서 많은 사용 예제를 제공하여 가능한 한 많은 컨텍스트를 시스템에 제공하세요.
여러 가지 적응 옵션을 넣고 이러한 옵션의 작동 방식을 확인해 보세요.
정확히 동일한 문장을 여러 번 반복하지 마세요. 나머지 입력에 대한 바이어스가 생길 수 있습니다.
일반적이지 않은 기호(~, # @ % &)는 무시되므로 포함하지 마세요. 해당 기호가 나타나는 문장도 삭제됩니다.
수십만 개의 문장과 같이 너무 많은 입력을 넣지 마세요. 이렇게 하면 강조 효과가 약화됩니다.

필수 조건

Azure 계정
Azure AI Video Indexer 계정

웹 포털
API

언어 모델 만들기

Azure AI Video Indexer 웹 사이트로 이동하여 로그인합니다.
계정에서 모델을 사용자 지정하려면 페이지 왼쪽에서 콘텐츠 모델 사용자 지정 단추를 선택합니다.
언어 탭을 선택합니다. 지원되는 언어 목록이 표시됩니다.
원하는 언어에서 모델 추가를 선택합니다.
언어 모델의 이름을 입력하고 Enter 키를 누릅니다. 이 단계에서는 모델이 생성되고 모델에 텍스트 파일을 업로드하는 옵션이 제공됩니다.
텍스트 파일을 추가하려면 파일 추가를 선택합니다. 파일 탐색기가 열립니다.
텍스트 파일을 탐색하여 선택합니다. 언어 모델에 여러 텍스트 파일을 추가할 수 있습니다. 언어 모델의 오른쪽에 있는 ... 단추를 선택하고 파일 추가를 선택하여 텍스트 파일을 추가할 수도 있습니다.
텍스트 파일 업로드를 완료했으면 녹색 학습 옵션을 선택합니다.

학습 프로세스는 몇 분 정도 걸릴 수 있습니다. 학습이 완료되면 모델 옆에 학습된 학습이 표시됩니다. 모델에서 파일을 미리 보고 다운로드하고 삭제할 수 있습니다.

새 비디오에서 언어 모델 사용

새 비디오에서 언어 모델을 사용하려면 다음 작업 중 하나를 수행합니다.

페이지 맨 위에 있는 업로드 단추를 선택합니다.
오디오 또는 비디오 파일을 놓거나 파일을 찾습니다.
비디오 원본 언어 드롭다운 목록에서 만든 언어 모델을 선택합니다.
페이지 맨 아래에 있는 업로드 옵션을 선택하면 새 비디오가 언어 모델을 사용하여 인덱싱됩니다.

언어 모델을 사용하여 다시 인덱싱

Azure AI Video Indexer 홈페이지에 로그인합니다.
비디오에서 ... 단추를 클릭하고 다시 인덱싱을 선택합니다.
비디오 원본 언어 드롭다운을 선택하고 목록에서 만든 언어 모델을 선택합니다.
다시 인덱스 단추를 선택하면 언어 모델을 사용하여 비디오가 다시 인덱싱됩니다.

언어 모델 편집

이름을 변경하고, 파일을 추가하고, 해당 모델에서 파일을 삭제하여 언어 모델을 편집할 수 있습니다. 언어 모델에서 파일을 추가하거나 삭제하는 경우 녹색 학습 옵션을 선택하여 모델을 다시 학습해야 합니다.

언어 모델 이름 바꾸기

언어 모델의 오른쪽에 있는 줄임표(...) 단추를 선택하고 이름 바꾸기를 선택하여 언어 모델의 이름을 변경할 수 있습니다. 새 이름을 입력합니다.

파일 추가

파일 추가를 선택합니다. 파일 탐색기가 열립니다.
텍스트 파일을 탐색하여 선택합니다. 언어 모델에 여러 텍스트 파일을 추가할 수 있습니다.

언어 모델의 오른쪽에 있는 줄임표(...) 단추를 선택하고 파일 추가를 선택하여 텍스트 파일을 추가할 수도 있습니다.

파일 삭제

이 작업은 언어 모델에서 파일을 완전히 제거합니다.

텍스트 파일의 오른쪽에 있는 줄임표(...) 단추를 선택합니다.
삭제를 선택합니다. 삭제를 실행 취소할 수 없음을 알리는 새 창이 팝업됩니다.
새 창에서 삭제 옵션을 선택합니다.

언어 모델 삭제

이 작업은 계정에서 언어 모델을 완전히 제거합니다. deletedlLanguage 모델을 사용하던 모든 비디오는 비디오를 다시 인덱싱할 때까지 동일한 인덱스를 유지합니다. 비디오를 다시 인덱싱하는 경우 비디오에 새 언어 모델을 할당할 수 있습니다. 할당하지 않으면 Azure AI Video Indexer는 기본 모델을 사용하여 비디오를 다시 인덱싱합니다.

언어 모델의 오른쪽에 있는 줄임표(...) 단추를 선택합니다.
삭제를 선택합니다. 삭제를 실행 취소할 수 없음을 알리는 새 창이 팝업됩니다.
새 창에서 삭제 옵션을 선택합니다.

대본을 수정하여 언어 모델 사용자 지정

Azure AI Video Indexer는 사용자가 비디오의 전사에 대한 실제 수정 사항에 따라 언어 모델을 사용자 지정합니다. 비디오의 전사에서 수정한 모든 줄을 캡처하여 텍스트 From transcript edits파일에 추가합니다. 이러한 편집은 비디오를 인덱싱하는 데 사용된 언어 모델을 다시 학습하는 데 사용됩니다.

위젯의 타임라인에서 수행된 편집 내용도 포함됩니다.

이 비디오를 인덱싱할 때 언어 모델을 지정하지 않은 경우 이 비디오에 대한 모든 편집 내용은 비디오의 검색된 언어 내에서 호출 Account adaptations 되는 기본 언어 모델에 저장됩니다.

동일한 줄에 여러 번의 편집이 이루어진 경우 수정된 줄의 마지막 버전만 언어 모델을 업데이트하는 데 사용됩니다.

참고 항목

사용자 지정에는 텍스트 수정만 사용됩니다. 실제 단어(예: 문장 부호 또는 공백)가 포함되지 않은 수정은 포함되지 않습니다.

라이브러리에서 편집할 비디오를 선택합니다.
타임라인 탭을 선택합니다.
연필 아이콘을 선택하여 대화 내용의 대본을 편집합니다.
대화 내용 수정 내용이 Con텐트 모드l 사용자 지정 페이지의 언어 탭에 표시됩니다. 각 언어 모델에 대한 "원본 대본 편집" 파일을 보려면 선택하여 엽니다.

언어 모델 만들기

언어 모델 만들기 요청은 지정된 계정에 대한 새 사용자 지정 언어 모델을 만듭니다. 이 요청을 사용하여 언어 모델에 대한 파일을 업로드할 수 있습니다. 또는 여기에서 언어 모델을 만들고 나중에 언어 모델을 업데이트하여 모델에 대한 파일을 업로드할 수 있습니다.

필요한 매개 변수에 대한 값을 제공하는 것 외에도 FormData를 사용하여 본문에 파일을 업로드해야 합니다. 이 작업에 대한 키 쌍을 정의하는 방법에는 두 가지가 있습니다.

키는 파일 이름이며 값은 txt 파일입니다.
키는 파일 이름이며 값은 txt 파일에 대한 URL입니다.

참고 항목

모델이 파일 내용을 파악하려면 활성화된 파일을 사용하여 모델을 학습해야 합니다.

예제 응답

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

언어 모델 학습

언어 모델 학습 요청은 언어 모델에서 업로드 및 활성화된 파일의 콘텐츠를 사용하여 지정된 계정에 대한 사용자 지정 언어 모델을 학습시킵니다.

참고 항목

먼저 언어 모델을 만들고 해당 파일을 업로드해야 합니다. 언어 모델을 만들거나 언어 모델을 업데이트하여 파일을 업로드할 수 있습니다.

예제 응답

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": false,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

이 id ID는 언어 모델을 구분하는 데 사용되는 고유 ID이며, languageModelId 비디오를 인덱 싱하고 비디오 요청을 다시 인덱싱하는 데 사용됩니다(Azure AI Video Indexer 업로드/다시 인덱싱 요청이라고 linguisticModelId 도 함).

언어 모델 삭제

언어 모델 삭제 요청은 지정된 계정에서 사용자 지정 언어 모델을 삭제합니다. 삭제된 언어 모델을 사용하던 모든 비디오는 비디오를 다시 인덱싱할 때까지 동일한 인덱스를 유지합니다. 비디오를 다시 인덱싱하는 경우 비디오에 새 언어 모델을 할당할 수 있습니다. 할당하지 않으면 Azure AI Video Indexer는 기본 모델을 사용하여 비디오를 다시 인덱싱합니다.

예제 응답

언어 모델이 성공적으로 삭제되면 반환된 콘텐츠가 없습니다.

언어 모델 업데이트

언어 모델 업데이트 요청은 지정된 계정에서 사용자 지정 언어 사용자 모델을 업데이트합니다.

참고 항목

언어 모델을 이미 만들었어야 합니다. 이 호출을 사용하여 해당 모델 내의 모든 파일을 사용하거나 사용하지 않도록 설정하고, 언어 모델의 이름을 업데이트하고, 언어 모델에 추가할 파일을 업로드할 수 있습니다.

언어 모델에 추가할 파일을 업로드하려면 위의 필수 매개 변수에 대한 값을 제공하는 것 외에도 FormData를 사용하여 본문에 파일을 업로드해야 합니다. 이 작업을 수행하는 방법은 다음 두 가지입니다.

키는 파일 이름이며 값은 txt 파일입니다.
키는 파일 이름이며 값은 txt 파일에 대한 URL입니다.

예제 응답

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

응답으로 반환된 파일의 id를 사용하여 파일의 콘텐츠를 다운로드합니다.

언어 모델에서 파일 업데이트

언어 모델 파일 업데이트 요청을 사용하면 지정된 계정의 사용자 지정 언어 모델에서 파일의 이름과 enable 상태를 업데이트할 수 있습니다.

예제 응답

{
  "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
  "name": "RenamedFile",
  "enable": false,
  "creator": "John Doe",
  "creationTime": "2018-04-27T20:10:10.5233333"
}

응답으로 반환된 파일의 id를 사용하여 파일의 콘텐츠를 다운로드합니다.

특정 언어 모델 가져오기

언어 모델 가져오기 요청은 언어 및 언어 모델에 있는 파일과 같이 지정된 계정의 지정된 언어 모델에 대한 정보를 반환합니다.

예제 응답

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

응답으로 반환된 파일의 id를 사용하여 파일의 콘텐츠를 다운로드합니다.

모든 언어 모델 가져오기

언어 모델 가져오기 요청은 목록의 지정된 계정에 있는 모든 사용자 지정 언어 모델을 반환합니다.

예제 응답

[
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
        "name": "TestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000000",
        "files": [
        {
            "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
            "name": "hellofile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.6733333"
        },
        {
            "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
            "name": "worldfile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.86"
        }
        ]
    },
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a892",
        "name": "AnotherTestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000001",
        "files": []
    }
]

언어 모델에서 파일 삭제

언어 모델 파일 삭제 요청은 지정된 계정의 지정된 언어 모델에서 지정된 파일을 삭제합니다.

예제 응답

언어 모델에서 파일이 성공적으로 삭제되면 반환된 콘텐츠가 없습니다.

언어 모델에서 파일의 메타데이터 가져오기

언어 모델 파일 데이터 가져오기 요청은 계정에서 선택한 언어 모델에서 지정된 파일의 내용과 메타데이터를 반환합니다.

예제 응답

{
    "content": "hello\r\nworld",
    "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
    "name": "Hello",
    "enable": true,
    "creator": "John Doe",
    "creationTime": "2018-04-27T20:10:10.5233333"
}

참고 항목

이 예제 파일의 내용은 두 줄로 된 단어 "hello"와 "world"입니다.

언어 모델에서 파일 다운로드

언어 모델 파일 콘텐츠 다운로드 요청은 지정된 계정의 지정된 언어 모델에서 지정된 파일의 내용이 포함된 텍스트 파일을 다운로드합니다. 이 텍스트 파일은 원래 업로드한 텍스트 파일의 내용과 일치해야 합니다.

예제 응답

응답은 JSON 형식의 파일 내용을 포함하는 텍스트 파일의 다운로드입니다.

다음을 통해 공유

Azure AI Video Indexer를 사용하여 언어 모델 사용자 지정

사용자 지정 언어 모델 최적화

필수 조건

언어 모델 만들기

새 비디오에서 언어 모델 사용

언어 모델을 사용하여 다시 인덱싱

언어 모델 편집

언어 모델 이름 바꾸기

파일 추가

파일 삭제

언어 모델 삭제

대본을 수정하여 언어 모델 사용자 지정

언어 모델 만들기

예제 응답

언어 모델 학습

예제 응답

언어 모델 삭제

예제 응답

언어 모델 업데이트

예제 응답

언어 모델에서 파일 업데이트

예제 응답

특정 언어 모델 가져오기

예제 응답

모든 언어 모델 가져오기

예제 응답

언어 모델에서 파일 삭제

예제 응답

언어 모델에서 파일의 메타데이터 가져오기

예제 응답

언어 모델에서 파일 다운로드

예제 응답

피드백

추가 리소스