概述
用法
数据集选择
- 注释类型必须与您的预测目标匹配:对于对象检测模型,数据集必须包含边界框注释。对于实例分割,注释除了边界框外还必须包含每个对象的掩码。对于其他类型的任务也是如此。
- 数据集质量很重要:确保注释 准确,图像内容多样,并且数据集足够大。我们通常建议至少 500-1000 张图像才能获得稳健的性能——但越多越好。
- 图像域应与您的部署环境匹配:训练图像应与您的模型在生产环境中将看到的图像相似。例如,如果您的工厂只使用蓝色 PCB,但数据集包含绿色 PCB,则可能无法很好地泛化。您可以尝试使用颜色增强来帮助处理这种域转移,或者搜索更适合您部署的数据集。
训练
loader 部分下的 params 中的 dataset_dir。我们为 Roboflow 数据集使用特殊的 URI 格式:Markdown
1roboflow://<TEAM_NAME>/<DATASET_NAME>/<DATASET_VERSION>/cocoMarkdown
1https://universe.roboflow.com/learn-uzoux/pcb-defect-0i1a7dataset_dir 为:Markdown
1roboflow://learn-uzoux/pcb-defect-0i1a7/2/coco如果数据集是您 Roboflow 团队的私有数据集,请务必在开始训练过程之前导出您的 Roboflow API 密钥:
export ROBOFLOW_API_KEY="<ADD_YOUR_ROBOFLOW_API_KEY_HERE>"