사용자 지정 모델 학습

모델은 특정 언어 쌍에 대한 번역을 제공합니다. 성공적인 학습의 결과가 모델입니다. 사용자 지정 모델을 학습시키려면 학습, 튜닝 및 테스트의 세 가지 상호 배타적인 문서 종류가 필요합니다. 학습을 대기 중일 때 학습 데이터를 제공하는 경우 Custom Translator는 자동으로 튜닝 및 테스트 데이터를 어셈블합니다. 학습 문서에서 임의의 문장 하위 집합을 사용하고 이러한 문장을 학습 데이터 자체에서 제외합니다. 전체 모델을 학습하려면 최소 10,000개의 병렬 학습 문장이 필요합니다.

모델 만들기

  1. 모델 학습 블레이드를 선택합니다.

  2. 모델 이름을 입력합니다.

  3. 기본 전체 학습을 선택한 상태로 유지하거나 사전 전용 학습을 선택합니다.

    참고 항목

    전체 학습은 업로드된 모든 문서 형식을 표시합니다. 사전 전용은 사전 문서만 표시합니다.

  4. 문서 선택에서 모델 학습에 사용할 문서(예: sample-English-German)를 선택하고 선택한 문장 수와 관련된 학습 비용을 검토합니다.

  5. 지금 학습을 선택합니다.

  6. 학습을 선택하여 확인합니다.

    참고 항목

    알림은 진행 중인 모델 학습(예: 데이터 제출 상태)을 표시합니다. 모델 학습에는 선택한 문장의 수에 따라 몇 시간이 걸립니다.

    Screenshot illustrating the train model blade.

사전 전용 학습을 선택해야 하는 경우

더 나은 결과를 위해 학습 데이터에서 시스템을 학습할 수 있도록 하는 것이 좋습니다. 그러나 10,000개의 최소 요구 사항을 충족하기에 충분한 병렬 문장이 없거나 문장과 복합 명사를 있는 그대로 렌더링해야 하는 경우 사전 전용 학습을 사용합니다. 일반적으로 모델은 전체 학습보다 훨씬 더 빠르게 학습을 완료합니다. 결과 모델은 사용자가 추가한 사전과 함께 번역에 대해 기준 모델을 사용합니다. BLEU 점수가 표시되거나 테스트 보고서가 표시되지 않습니다.

참고 항목

사용자 지정 번역기는 사전 파일을 문장 정렬하지 않습니다. 따라서 사전 문서의 원본 및 대상 구/문장의 수가 동일해야 하며 정확하게 정렬되어야 합니다. 그렇지 않으면 문서 업로드가 실패합니다.

모델 세부 정보

  1. 모델 학습에 성공하면 모델 세부 정보 블레이드를 선택합니다.

  2. 모델 이름을 선택하여 학습 날짜/시간, 총 학습 시간, 학습, 튜닝, 테스트, 사전에 사용된 문장 수 및 시스템에서 테스트 및 튜닝 집합을 생성했는지 여부를 검토합니다. Category ID를 사용하여 번역을 요청합니다.

  3. 모델 BLEU 점수를 평가합니다. 테스트 집합 검토: BLEU 점수는 사용자 지정 모델 점수이고 기준 BLEU는 사용자 지정에 사용되는 미리 학습된 기준 모델입니다. BLEU 점수가 높을수록 사용자 지정 모델을 사용하는 번역 품질이 높아질 수 있습니다.

    Screenshot illustrating model details fields.

중복 모델

  1. 모델 세부 정보 블레이드를 선택합니다.

  2. 모델 이름을 마우스로 가리키고 선택 단추를 확인합니다.

  3. 복제를 선택합니다.

  4. 새 모델 이름을 입력합니다.

  5. 추가 데이터가 선택되거나 업로드되지 않으면 즉시 학습을 확인합니다. 그렇지 않으면 초안으로 저장을 선택합니다.

  6. 저장을 선택합니다.

    참고 항목

    모델을 Draft로 저장하면 모델 세부 정보Draft 상태의 모델 이름으로 업데이트됩니다.

    문서를 더 추가하려면 모델 이름을 선택하고 위의 Create model 섹션을 따릅니다.

    Screenshot illustrating the duplicate model blade.

다음 단계