모델 성능이 원하는 점수가 아닌 경우, 몇 가지를 시도해 볼 수 있습니다. 이러한 팁은 모델을 조정하여 예측 능력을 향상시키는 데 도움이 됩니다.
보다 정확하게 레이블이 지정된 학습 데이터를 추가합니다.
레이블이 지정된 교육 데이터가 정확할 수록 모델 성능이 향상됩니다. 예를 들어 예/아니요 레이블이 있다고 가정해 보겠습니다. 이 열에 예만 있는 데이터가 대부분이라면 AI 모델은 이 데이터로부터 많은 것을 학습하지 못할 것입니다. 데이터에 올바르게 레이블이 지정되어 있지 않으면 모델이 잘 학습되지 않을 수 있습니다. 올바르게 레이블이 지정된 작은 예 집합(100개 이하)로 시작하는 것이 이상적입니다. 여기에서 반복적으로 예의 수를 두 배로 늘리고 매번 성능을 변경하면서 매번 재학습시킬 수 있습니다. 일반적으로 데이터가 많을수록 좋지만 데이터 세트가 클수록 데이터를 추가할 경우 수익이 감소합니다.
팁 더 보기
- 학습 데이터에서 태그를 균형 있게 사용해야 합니다. 예를 들어 100개의 텍스트 항목에 대해 4개의 태그가 있습니다. 두 개의 첫 번째 태그(tag1 및 tag2)은 90개의 텍스트 항목에 사용되지만 다른 2개(tag3 및 tag4)는 나머지 10개의 텍스트 항목에만 사용됩니다. 균형이 없으면 모델이 tag3 또는 tag4를 올바르게 예측하기 어려울 수 있습니다.
- 모델을 사용할 것으로 예상되는 것과 유사한 데이터를 사용하여 모델을 학습시켜야 합니다.