如何改善您的 自訂視覺 模型

在本指南中,您將瞭解如何改善 自訂視覺 模型的品質。 分類器對象偵測器的品質取決於您提供的數量、品質和各種標記數據,以及整體數據集的平衡程度。 良好的模型具有平衡的定型數據集,代表將提交至該數據集的內容。 建置這類模型的程式是反覆的;通常需要幾輪訓練才能達到預期的結果。

以下是一般模式,可協助您定型更精確的模型:

  1. 第一輪訓練
  2. 新增更多影像並平衡數據;培訓
  3. 新增具有不同背景、光源、物件大小、相機角度和樣式的影像;培訓
  4. 使用新的影像來測試預測
  5. 根據預測結果修改現有的定型數據

防止過度學習

有時候,模型會學習根據影像共同擁有的任意特性進行預測。 例如,如果您要為蘋果與柑橘建立分類器,而且您已在手裡使用蘋果的影像,以及白盤上的柑橘影像,分類器可能會對手與盤子,而不是蘋果與柑橘給予不當的重要性。

若要更正此問題,請提供不同角度、背景、物件大小、群組和其他變化的影像。 下列各節會擴充這些概念。

數據數量

定型影像數目是數據集最重要的因素。 我們建議使用每個標籤至少50個影像作為起點。 使用較少的影像時,過度學習的風險較高,而您的效能數位可能會建議品質良好,但您的模型可能會與真實世界數據作鬥爭。

數據餘額

您也必須考慮定型數據的相對數量。 例如,針對一個標籤使用500個影像,另一個標籤則使用500個影像來建立不平衡的定型數據集。 這會導致模型在預測一個標籤時比另一個標籤更精確。 如果您在具有最少影像的標籤和具有最多影像的標籤之間至少維持 1:2 的比例,您可能會看到更好的結果。 例如,如果具有最多影像的標籤有500個影像,則具有最少影像的標籤應該至少有250個影像來進行定型。

資料多樣性

請務必使用代表在正常使用期間提交至分類器的影像。 否則,您的模型可以學習根據影像共同擁有的任意特性進行預測。 例如,如果您要為蘋果與柑橘建立分類器,而且您已在手裡使用蘋果的影像,以及白盤上的柑橘影像,分類器可能會對手與盤子,而不是蘋果與柑橘給予不當的重要性。

Photo of fruits with unexpected matching.

若要更正此問題,請包含各種不同的影像,以確保您的模型可以妥善地一般化。 以下是一些您可以讓訓練集更加多樣化的方式:

  • 背景: 在不同的背景前面提供物件的影像。 自然內容中的相片比中性背景前的相片更好,因為它們會為分類器提供更多資訊。

    Photo of background samples.

  • 光源: 提供不同光源的影像(也就是以閃光、高曝光等方式拍攝),特別是用於預測的影像有不同的光源時。 使用具有不同飽和度、色調和亮度的影像也很有説明。

    Photo of lighting samples.

  • 物件大小: 提供物件大小和數字變化的影像(例如,一堆香蕉的照片和單一香蕉的特寫)。 不同的重設大小有助於分類器更妥善地一般化。

    Photo of size samples.

  • 相機 角度:提供以不同相機角度拍攝的影像。 或者,如果所有相片都必須使用固定相機拍攝(例如監視相機),請務必將不同的標籤指派給每個經常發生的物件,以避免過度學習—將不相關的物件(如燈柱)解譯為主要功能。

    Photo of angle samples.

  • 樣式: 提供相同類別不同樣式的影像(例如,相同水果的不同品種)。 不過,如果您有截然不同的樣式物件(例如Mickey Mouse與實際滑鼠),建議您將它們標記為個別類別,以更好地代表其不同的特徵。

    Photo of style samples.

負面影像(僅限分類器)

如果您使用影像分類器,您可能需要新增 負樣本 ,以協助分類器更精確。 負樣本是不符合任何其他標籤的影像。 當您上傳這些影像時,請將特殊的 標籤套用至它們。

對象偵測器會自動處理負樣本,因為繪製周框方塊以外的任何影像區域都會被視為負數。

注意

自訂視覺 服務支援一些自動負影像處理。 例如,如果您要建置葡萄與香蕉分類器,並提交鞋子的影像以進行預測,分類器應該針對葡萄和香蕉將該影像評分為接近 0%。

另一方面,如果負面影像只是定型中使用的影像變化,模型可能會因為非常相似性而將負影像分類為加上標籤的類別。 例如,如果您有柳丁與葡萄果分類器,而且您在clementine的影像中饋送,它可能會將clementine評分為橙色,因為clementine的許多特徵與柳丁相似。 如果您的負面影像屬於此性質,建議您在定型期間建立一或多個額外的標記(例如 Other),並將具有此標籤的負影像加上標籤,讓模型能夠更好地區分這些類別。

遮蔽和截斷 (僅限物件偵測器)

如果您想要讓物件偵測器偵測截斷的物件(部分剪下影像的物件)或遮蔽的物件(影像中其他物件部分封鎖的物件),則必須包含涵蓋這些案例的定型影像。

注意

其他物件遮蔽的對象問題不會與 分級模型效能的參數重疊臨界值混淆。 自訂視覺 網站上的 [重迭閾值] 滑桿會處理預測周框方塊必須與真實周框方塊重疊多少,才能視為正確。

使用預測影像進行進一步定型

當您藉由將影像提交至預測端點來使用或測試模型時,自訂視覺 服務會儲存這些映像。 然後,您可以使用它們來改善模型。

  1. 若要檢視提交至模型的影像,請開啟 自訂視覺 網頁,移至您的專案,然後選取 [預測] 索引標籤。默認檢視會顯示來自目前反覆專案的影像。 您可以使用 [ 反復專案 ] 下拉功能表來檢視先前反覆項目期間提交的影像。

    screenshot of the predictions tab, with images in view

  2. 將滑鼠停留在影像上,以查看模型所預測的標記。 影像會進行排序,讓可將最改善的影像列在頂端。 若要使用不同的排序方法,請在 [排序] 區段中選取專案

    若要將影像新增至現有的定型數據,請選取映像、設定正確的標籤,然後選取 [ 儲存並關閉]。 影像將會從 預測 中移除,並新增至定型影像集。 您可以選取 [ 定型影像 ] 索引標籤來檢視它。

    Screenshot of the tagging page.

  3. 然後使用 [ 定型] 按鈕重新定型模型。

以可視化方式檢查預測

若要檢查影像預測,請移至 [定型影像] 索引標籤,在 [反復專案] 下拉功能表中選取您先前的定型反覆專案,然後在 [卷標] 區段底下檢查一或多個標籤。 檢視現在應該會在模型無法正確預測指定標籤的每個影像周圍顯示紅色方塊。

Image of the iteration history

有時候,視覺檢查可以識別模式,您可以藉由新增更多定型數據或修改現有的定型數據來更正。 例如,蘋果與石灰的分類器可能會錯誤地將所有綠色蘋果標記為石灰。 接著,您可以新增並提供包含綠色蘋果標記影像的訓練數據,以更正此問題。

下一步

在本指南中,您已了解數種技術,讓您的自定義影像分類模型或對象偵測器模型更精確。 接下來,瞭解如何透過將影像提交至預測 API,以程式設計方式測試影像。