다음을 통해 공유


모델 미세 조정 개념

미세 조정은 미리 학습된 모델을 가져와 데이터에 더 잘 맞도록 조정하는 프로세스입니다. 이 프로세스는 데이터를 최대한 활용하고 모델의 성능을 향상시키는 데 도움이 될 수 있습니다. 이 문서에서는 미세 조정의 기본 개념과 AI 모델을 미세 조정하는 것이 적절한 경우에 대해 알아봅니다.

소개

미세 조정은 데이터를 더 많이 가져오는 데 도움이 되는 강력한 기술입니다. 미세 조정을 이해하려면 전이 학습의 개념을 이해하는 것이 중요합니다. 전이 학습은 한 작업에 대해 학습된 모델이 두 번째 관련 작업에서 다시 용도가 지정된 기계 학습 기술입니다. 이 작업은 미리 학습된 모델을 사용하고 새 데이터에 더 잘 맞게 조정하여 수행됩니다. 미세 조정은 미리 학습된 모델이 새 데이터에 더 잘 맞도록 조정되는 전송 학습의 한 형태입니다.

모델 미세 조정과 관련된 몇 가지 단계가 있습니다. 먼저 작업에 적합한 미리 학습된 모델을 선택해야 합니다. 다음으로 샘플 데이터를 준비하고 이 데이터에 대한 모델을 미세 조정해야 합니다. 마지막으로 성능을 향상시키려면 모델을 반복해야 합니다.

미세 조정 시기

미세 조정은 적은 양의 데이터가 있고 모델의 성능을 향상하려는 경우에 적합합니다. 미리 학습된 모델부터 시작하여 모델이 이미 학습한 지식을 활용하고 데이터에 더 잘 맞도록 조정할 수 있습니다. 이렇게 하면 모델의 성능을 개선하고 학습하는 데 필요한 데이터의 양을 줄일 수 있습니다.

대개 많은 양의 데이터가 있는 경우 모델을 미세 조정할 필요가 없습니다. 이 경우 모델을 처음부터 학습시키고 미세 조정 없이도 좋은 성능을 얻을 수 있습니다. 그러나 모델의 성능을 더 향상시키려면 이 경우 미세 조정이 여전히 유용할 수 있습니다. 미리 학습된 모델이 원래 학습된 작업과 다른 특정 작업이 있는 경우 모델을 미세 조정할 수도 있습니다.

프롬프트 엔지니어링 또는 프롬프트 체인을 사용하여 모델의 비용이 많이 드는 미세 조정을 방지할 수 있습니다. 이러한 기술은 미세 조정 없이 고품질 텍스트를 생성하는 데 도움이 될 수 있습니다.

미리 학습된 모델 선택

작업 요구 사항에 적합한 미리 학습된 모델을 선택해야 합니다. 다양한 작업에서 학습된 많은 미리 학습된 모델을 사용할 수 있습니다. 작업 중인 것과 유사한 작업에 대해 학습된 모델을 선택해야 합니다. 이렇게 하면 모델이 이미 학습한 지식을 활용하고 데이터에 더 잘 맞도록 조정하는 데 도움이 됩니다.

HuggingFace 모델은 미리 학습된 모델을 검색할 때 시작하는 데 적합합니다. HuggingFace 모델은 학습된 작업에 따라 범주로 그룹화되므로 작업에 적합한 모델을 쉽게 찾을 수 있습니다.

이러한 범주는 다음과 같습니다.

  • 복합
  • 컴퓨터 비전
  • 자연어 처리
  • 오디오
  • 테이블 형식
  • 보충 학습

환경 및 사용 중인 도구와 모델의 호환성을 확인합니다. 예를 들어 사용하는 Visual Studio Code경우 확장을 Visual Studio Code 사용하여 Azure Machine Learning 모델을 미세 조정할 수 있습니다.

모델의 상태 및 라이선스를 확인합니다. 일부 미리 학습된 모델은 오픈 소스 라이선스에서 사용할 수 있지만 다른 모델은 상업용 또는 개인 라이선스를 사용해야 할 수 있습니다. 모든 모델에는 HuggingFace 라이선스 정보가 포함됩니다. 모델을 미세 조정하기 전에 모델을 사용하는 데 필요한 권한이 있는지 확인합니다.

샘플 데이터 준비

샘플 데이터를 준비하려면 학습에 적합하도록 데이터를 클린 전처리해야 합니다. 또한 모델의 성능을 평가하려면 데이터를 학습 및 유효성 검사 집합으로 분할해야 합니다. 데이터 형식은 사용 중인 미리 학습된 모델에서 예상하는 형식과 일치해야 합니다. 이 정보는 모델 카드 지침 형식 섹션의 모델 HuggingFace 에서 찾을 수 있습니다. 대부분의 모델 카드 모델에 대한 프롬프트를 작성하기 위한 템플릿과 시작하는 데 도움이 되는 의사 코드가 포함됩니다.

모델에서 반복

모델을 미세 조정한 후에는 유효성 검사 집합에서 해당 성능을 평가해야 합니다. 정확도, 정밀도, 재현율 및 F1 점수와 같은 메트릭을 사용하여 모델의 성능을 평가할 수 있습니다. 모델의 성능이 만족스럽지 않은 경우 하이퍼 매개 변수를 조정하거나 아키텍처를 변경하거나 더 많은 데이터에 대해 모델을 미세 조정하여 모델을 반복할 수 있습니다. 데이터의 품질 및 다양성을 검사하여 해결해야 하는 문제가 있는지 확인할 수도 있습니다. 일반적으로 더 작은 고품질 데이터 집합은 더 큰 저품질 데이터 집합보다 더 가치가 있습니다.

참고 항목

AI 모델 미세 조정에 대해 자세히 알아보려면 다음 리소스를 검사.