사전이란?
사전은 구 또는 문장의 목록과 해당 번역을 지정하는 문서의 정렬된 쌍입니다. 사용자가 Translator에서 사용자가 사전에 제공한 번역을 사용하여 원본 구 또는 문장의 인스턴스를 번역하길 원하는 경우 학습의 사전을 사용합니다. 사전은 종종 용어집 또는 용어 기반이라고도 합니다. 사전을 사용자가 나열한 모든 용어에 대해 무차별적인 "복사 및 바꾸기"로 생각할 수 있습니다. 또한 Microsoft Custom Translator 서비스는 자체 범용 사전을 빌드하고 이를 사용하여 번역 품질을 향상시킵니다. 단, 단어나 문장을 찾기 위해서는 고객이 제공한 사전을 우선하여 먼저 검색합니다.
사전은 Microsoft 일반 인공신경망 모델이 완벽하게 지원되는 언어 쌍의 프로젝트에서만 작동합니다. 언어의 전체 목록을 확인합니다.
구 사전
구(Phrase) 사전은 대/소문자를 구분합니다. 정확한 찾기 및 바꾸기 작업입니다. 모델을 학습할 때 구 사전을 포함하면 나열된 단어 또는 구는 사용자가 지정한 방식으로 번역됩니다. 문장의 나머지는 일반적인 방법으로 번역됩니다. 구 사전을 사용하여 번역하면 안 되는 구를 지정할 수 있습니다. 원본 및 대상 파일에 번역되지 않은 동일한 구를 제공하면 됩니다.
동적 사전
동적 사전 기능을 사용하면 특정 용어나 구에 대한 번역을 사용자 지정할 수 있습니다. 고유한 상황, 언어 또는 특정 요구 사항에 맞게 사용자 지정 번역을 정의합니다.
신경망 구 사전
신경망 구 사전은 동적 사전 및 표준 구 사전 기능을 확장합니다. 동적 사전 및 구 사전을 사용하면 특정 용어나 구에 대한 자체 번역을 제공하여 번역 출력을 사용자 지정할 수 있습니다. 동적 사전 기능은 Translator API와 함께 사용되는 반면 신경망 구 사전은 Custom Translator를 통해 사용하도록 설정됩니다. 신경망 구 사전은 기계 번역 모델이 용어와 컨텍스트를 모두 조정하도록 하여 하나 이상의 용어 번역을 포함하는 문장의 번역 품질을 개선합니다. 이 조정을 통해 더 유창하게 번역할 수 있습니다. 동시에 높은 번역 정확도를 유지합니다.
문장 사전
문장 사전은 대/소문자를 구분하지 않습니다. 문장 사전을 사용하면 원본 문장에 대한 정확한 대상 번역을 지정할 수 있습니다. 문장 사전 일치가 발생하려면 제출된 전체 문장이 원본 사전 항목과 일치해야 합니다. 문장 부호로 끝나는 원본 사전 항목은 일치 중에 무시됩니다. 문장의 일부만 일치하면 항목이 일치하지 않습니다. 일치하는 항목이 검색되면 문장 사전의 대상 항목이 반환됩니다.
사전 전용 학습
사전 데이터만 사용하여 모델을 학습할 수 있습니다. 이렇게 하려면 포함하려는 사전 문서만 선택(또는 여러 사전 문서)하고 모델 만들기를 선택합니다. 이 학습은 사전 전용이므로 최소 학습 문장 수가 필요하지 않습니다. 모델은 일반적으로 표준 학습보다 빠르게 학습을 완료합니다. 결과 모델은 사용자가 추가한 사전과 함께 번역을 위해 Microsoft 기준 모델을 사용합니다. 테스트 보고서를 가져올 수 없습니다.
참고 항목
Custom Translator에는 문장 정렬 사전 파일이 없으므로 사전 문서의 원본 및 대상 구/문장의 수가 동일해야 하며 정확하게 정렬되어야 합니다.
권장 사항
사전은 학습 데이터를 사용한 모델 학습 대용으로 사용할 수 없습니다. 더 나은 결과를 위해 학습 데이터에서 시스템을 학습할 수 있도록 하는 것이 좋습니다. 단, 문장이나 복합명사를 그대로 번역해야 하는 경우에는 구 사전을 사용합니다.
구 사전은 꼭 필요할 때만 사용해야 합니다. 문장 내에서 구가 바뀌면 해당 문장의 문맥이 사라지거나 문장의 나머지 부분을 번역하는 데 제한적이 됩니다. 그러면 문장 내 구 또는 단어가 제공된 사전에 따라 번역되고 문장의 전체 번역 품질이 자주 저하될 것입니다.
구 사전은 제품 이름("Microsoft SQL Server"), 고유 명사("City of Hamburg") 또는 제품 기능("pivot 테이블")과 같이 복합 명사에 적합합니다. 동사나 형용사에 대해서도 잘 작동하지 않습니다. 이러한 단어는 일반적으로 원본 또는 대상 언어 내에서 컨텍스트가 매우 다르기 때문입니다. 복합 명사 이외의 항목에 대해서는 구 사전 항목 사용을 피하는 것이 좋습니다.
구 사전을 사용하는 경우 대/소문자와 문장 부호가 중요합니다. 사전 항목은 대/소문자와 문장 부호를 구분합니다. Custom Translator는 원본 사전 파일에 지정된 것과 정확히 동일한 대문자 및 문장 부호를 사용하는 입력 문장의 단어 및 구만 일치시킵니다. 또한 번역에는 대상 사전 파일에 제공된 대/소문자 및 문장 부호가 반영됩니다.
예제
- 구 사전을 사용하는 영어-스페인어 시스템을 학습하고 원본 파일에 SQL Server를 지정하고 대상 파일에 Microsoft SQL Server를 지정하는 경우. SQL Server라는 구가 포함된 문장의 번역을 요청하면 Custom Translator는 사전 항목과 Microsoft SQL Server가 포함된 번역을 일치시킵니다.
- 동일한 구를 포함하지만 원본 파일의 내용(예: sql server, sql Server 또는 SQL Server)과 일치하지 않는 문장의 번역을 요청하면 사전에서 일치 항목이 반환되지 않습니다.
- 번역은 구 사전에 지정된 대상 언어의 규칙을 따릅니다.
신경망 구 사전에 대한 자세한 내용은 신경망 사전 지침 및 권장 사항을 참조하세요.
문장 사전을 사용하는 경우 문장 끝 문장 부호는 무시됩니다.
예제
- 원본 사전에 "This sentence ends with punctuation!"가 포함된 경우 "This sentence ends with punctuation"가 포함된 모든 번역 요청이 일치합니다.
사전에는 고유한 원본 행이 포함되어야 합니다. 원본 행(단어, 구 또는 문장)이 사전 파일에 두 번 이상 나타나는 경우 시스템은 항상 제공된 마지막 항목을 사용하고 일치 항목이 발견되면 대상을 반환합니다.
원본 사전 파일에 숫자로만 구성되거나 약어와 같이 2자 또는 3자 단어인 구를 추가하지 마세요.