如何改善您的自訂視覺模型

發行項
02/23/2024

在本指南中，您將瞭解如何改善自訂視覺模型的品質。分類器或對象偵測器的品質取決於您提供的數量、品質和各種標記數據，以及整體數據集的平衡程度。良好的模型具有平衡的定型數據集，代表將提交至該數據集的內容。建置這類模型的程式是反覆的;通常需要幾輪訓練才能達到預期的結果。

以下是一般模式，可協助您定型更精確的模型：

第一輪訓練
新增更多影像並平衡數據;培訓
新增具有不同背景、光源、物件大小、相機角度和樣式的影像;培訓
使用新的影像來測試預測
根據預測結果修改現有的定型數據

防止過度學習

有時候，模型會學習根據影像共同擁有的任意特性進行預測。例如，如果您要為蘋果與柑橘建立分類器，而且您已在手裡使用蘋果的影像，以及白盤上的柑橘影像，分類器可能會對手與盤子，而不是蘋果與柑橘給予不當的重要性。

若要更正此問題，請提供不同角度、背景、物件大小、群組和其他變化的影像。下列各節會擴充這些概念。

數據數量

定型影像數目是數據集最重要的因素。我們建議使用每個標籤至少50個影像作為起點。使用較少的影像時，過度學習的風險較高，而您的效能數位可能會建議品質良好，但您的模型可能會與真實世界數據作鬥爭。

數據餘額

您也必須考慮定型數據的相對數量。例如，針對一個標籤使用500個影像，另一個標籤則使用500個影像來建立不平衡的定型數據集。這會導致模型在預測一個標籤時比另一個標籤更精確。如果您在具有最少影像的標籤和具有最多影像的標籤之間至少維持 1：2 的比例，您可能會看到更好的結果。例如，如果具有最多影像的標籤有500個影像，則具有最少影像的標籤應該至少有250個影像來進行定型。

資料多樣性

請務必使用代表在正常使用期間提交至分類器的影像。否則，您的模型可以學習根據影像共同擁有的任意特性進行預測。例如，如果您要為蘋果與柑橘建立分類器，而且您已在手裡使用蘋果的影像，以及白盤上的柑橘影像，分類器可能會對手與盤子，而不是蘋果與柑橘給予不當的重要性。

Photo of fruits with unexpected matching.

若要更正此問題，請包含各種不同的影像，以確保您的模型可以妥善地一般化。以下是一些您可以讓訓練集更加多樣化的方式：

背景： 在不同的背景前面提供物件的影像。自然內容中的相片比中性背景前的相片更好，因為它們會為分類器提供更多資訊。
光源： 提供不同光源的影像（也就是以閃光、高曝光等方式拍攝），特別是用於預測的影像有不同的光源時。使用具有不同飽和度、色調和亮度的影像也很有説明。
物件大小： 提供物件大小和數字變化的影像（例如，一堆香蕉的照片和單一香蕉的特寫）。不同的重設大小有助於分類器更妥善地一般化。
相機角度：提供以不同相機角度拍攝的影像。或者，如果所有相片都必須使用固定相機拍攝（例如監視相機），請務必將不同的標籤指派給每個經常發生的物件，以避免過度學習—將不相關的物件（如燈柱）解譯為主要功能。
樣式： 提供相同類別不同樣式的影像（例如，相同水果的不同品種）。不過，如果您有截然不同的樣式物件（例如Mickey Mouse與實際滑鼠），建議您將它們標記為個別類別，以更好地代表其不同的特徵。

負面影像（僅限分類器）

如果您使用影像分類器，您可能需要新增 負樣本 ，以協助分類器更精確。負樣本是不符合任何其他標籤的影像。當您上傳這些影像時，請將特殊的負標籤套用至它們。

對象偵測器會自動處理負樣本，因為繪製周框方塊以外的任何影像區域都會被視為負數。

注意

自訂視覺服務支援一些自動負影像處理。例如，如果您要建置葡萄與香蕉分類器，並提交鞋子的影像以進行預測，分類器應該針對葡萄和香蕉將該影像評分為接近 0%。

另一方面，如果負面影像只是定型中使用的影像變化，模型可能會因為非常相似性而將負影像分類為加上標籤的類別。例如，如果您有柳丁與葡萄果分類器，而且您在clementine的影像中饋送，它可能會將clementine評分為橙色，因為clementine的許多特徵與柳丁相似。如果您的負面影像屬於此性質，建議您在定型期間建立一或多個額外的標記（例如 Other），並將具有此標籤的負影像加上標籤，讓模型能夠更好地區分這些類別。

遮蔽和截斷（僅限物件偵測器）

如果您想要讓物件偵測器偵測截斷的物件（部分剪下影像的物件）或遮蔽的物件（影像中其他物件部分封鎖的物件），則必須包含涵蓋這些案例的定型影像。

注意

其他物件遮蔽的對象問題不會與 分級模型效能的參數重疊臨界值混淆。 自訂視覺網站上的 [重迭閾值] 滑桿會處理預測周框方塊必須與真實周框方塊重疊多少，才能視為正確。

使用預測影像進行進一步定型

當您藉由將影像提交至預測端點來使用或測試模型時，自訂視覺服務會儲存這些映像。然後，您可以使用它們來改善模型。

若要檢視提交至模型的影像，請開啟自訂視覺網頁，移至您的專案，然後選取 [預測] 索引標籤。默認檢視會顯示來自目前反覆專案的影像。您可以使用 [ 反復專案 ] 下拉功能表來檢視先前反覆項目期間提交的影像。
將滑鼠停留在影像上，以查看模型所預測的標記。影像會進行排序，讓可將最改善的影像列在頂端。若要使用不同的排序方法，請在 [排序] 區段中選取專案。

若要將影像新增至現有的定型數據，請選取映像、設定正確的標籤，然後選取 [ 儲存並關閉]。影像將會從預測中移除，並新增至定型影像集。您可以選取 [ 定型影像 ] 索引標籤來檢視它。
然後使用 [ 定型] 按鈕重新定型模型。