收集影像

發行項
2024/01/10

若要將物件偵測模型定型以辨識物件，您必須收集包含這些物件的影像。遵循影像數量與品質的指導方針以取得更好的結果。

格式和大小

提供給物件偵測模型的影像需要下列特性：

格式：
- JPG
- PNG
- BMP
大小：
- 定型最大 6MB
- 256 x 256 象素的最小寬度/高度

資料數量和資料餘額

務必上傳足夠的影像來將您的 AI 模型定型。定型集的每個物件一開始最好有至少 15 個影像。在使用較少影像的情況下，您的模型很可能會學習到實際上是雜訊或不相關的概念。使用更多的影像來為模型定型應該能提高準確度。

另一個考量是讓資料之間能達到平衡。如果您針對某個物件有 500 個影像，但對於另一個物件只有 50 個影像，您的定型資料集將會不平衡。這可能會導致模型比較能夠辨識其中一個物件。若要取得較一致的結果，請在具有最少影像及最多影像的物件之間，保持至少 1:2 的比例。例如，如果影像數量最多的物件有 500 個影像，那麼影像數量最少的物件應該至少要有 250 個影像用於定型。

使用更多樣化的影像

提供能代表人們會在正常使用期間提交給模型的影像。例如，假設您正在將模型定型以辨識蘋果。如果您只使用位於盤子上之蘋果的影像來定型，模型可能無法一致地辨識位於樹上的蘋果。包括不同種類的影像將能確保您的模型不會產生偏差，而且能適當地一般化。下列是一些可讓您的定型集更加多樣化的方法。

背景

在不同背景前面使用您的物件的影像，例如，盤子、雙手和樹木上的水果。呈現相關內容的相片能為分類器提供更多資訊，因此它們比背後為中性背景的相片更好。

影像背景。

光源

使用具有不同光源的定型影像，特別是在用於偵測的影像可能會具有不同光源的情況下。例如，包含使用閃光燈、高曝光等方式拍攝的影像。包含具有不同飽和度、色調及亮度的影像也會很有幫助。您的裝置相機可能會讓您控制這些設定。

影像光源。

物件大小

擷取物件的不同部分以提供有各種不同大小物件的影像，例如數串香蕉的相片和一根香蕉的特寫。不同的大小可協助模型更適當地一般化。

物件大小。

攝影機角度

嘗試提供從不同角度拍攝的影像。如果您所有相片都是來自一組固定的相機 (例如監視攝影機)，請為每個相機指派不同的標籤。這可協助避免將不相關的物件 (例如路燈) 模型化為重要特徵。即使所有相機都是拍攝相同的物件，也請為其指派相機標籤。

攝影機角度。

非預期的結果

AI 模型可能會錯誤地學習您影像所具備的共同特性。假設您想要建立能夠區分蘋果和柑橘的模型。如果您使用位於手中的蘋果與位於白盤上柑橘的影像，模型可能會以手與白盤來定型，而不是蘋果與柑橘。

非預期的結果。

若要更正此問題，請使用上述指引搭配更多樣化的影像來定型：提供具有不同角度、背景、物件大小、群組及其他變化的影像。

開始使用物件偵測

共用方式為

收集影像

格式和大小

資料數量和資料餘額

使用更多樣化的影像

背景

光源

物件大小

攝影機角度

非預期的結果

意見反應

其他資源

共用方式為

收集影像

格式和大小

資料數量和資料餘額

使用更多樣化的影像

背景

光源

物件大小

攝影機角度

非預期的結果

相關資訊

意見反應

其他資源