收集图像
要训练对象检测模型来识别对象,必须收集包含这些对象的图像。 要获得更好的结果,请遵循有关图像数量和质量的准则。
将提供对象检测模型的图像需要以下特征:
格式:
- JPG
- PNG
- BMP
大小:
- 做多培训 6 MB
- 最小宽度/高度为 256 像素 x 256 像素
务必要上传足够多的图像来训练 AI 模型。 每个对象至少 15 张图像的训练集是不错的起点。 如果图像较少,您的模型很有可能学习仅仅是噪声或不相关的概念。 使用更多图像训练模型应该可以提高准确性。
另一个考虑因素是,应确保数据平衡。 如果一个对象有 500 张图像,而另一个对象只包含 50 张图像,训练数据集将不平衡。 这可能会导致模型更擅于识别其中一个对象。 为了获得更一致的结果,请在图像最少的对象和图像最多的对象之间保持至少 1:2 的比率。 例如,如果图像数最大的对象具有 500 张图像,则图像最少的对象应至少具有 250 张图像用于训练。
提供将在正常使用期间提交到模型的代表图像。 例如,假设您正在训练一个模型来识别苹果。 如果您只训练盘子上的苹果图像,它可能无法一致识别出树上的苹果。 涵盖各种不同图像可确保模型不偏重某方面,涵盖所有方面。 下面是可使训练集更加多样化的一些方法。
在不同背景前使用对象的图像 - 例如,水果在盘子里,在手上和在树上。 场景中的照片比中性背景前的照片更好,因为前者为分类器提供了更多信息。
使用具有不同光照的训练图像,特别是用于检测的图像可能具有不同光照。 例如,包括通过闪光灯、高曝光度等方式拍摄的图像。 涵盖不同饱和度、色调和亮度的图像也很有帮助。 设备相机可能允许您控制这些设置。
提供的图像中,对象具有不同大小,拍摄了对象的不同部分 - 例如,几束香蕉的照片和一只香蕉的特写。 不同的大小有助于模型涵盖所有方面。
尽量提供从不同角度拍摄的图像。 如果所有照片都来自一组固定相机(如监控摄像头),请为每个相机分配一个不同标签。 这有助于避免对不相关的对象(如灯柱)建模为关键特征。 为相机分配标签,即使相机捕获相同对象。
AI 模型可能会错误地获知图像通用的特征。 假设你要创建一个模型来区分苹果与柑橘。 如果使用手中的苹果和白盘中的柑橘的图像,则模型可能针对手与白盘进行训练,而不是针对苹果与柑橘。
若要解决此问题,请使用上述指导训练更多不同的图像:提供不同角度、背景、对象大小、组和其他变量的图像。