此页面由 AI 自动翻译。查看英文原版

本页目录

  • 概述
  • 用法
  • 数据集选择
  • 训练
  • 后续步骤

Roboflow Universe

Supported on:RVC2RVC4

概述

Roboflow 是一个全面的平台,旨在简化构建、训练和部署计算机视觉模型的过程。其核心功能之一是 Roboflow Universe,这是一个由社区驱动的平台,用户可以在其中共享和探索各种用例的带注释计算机视觉数据集。在此集成中,我们专注于使用 来自 Roboflow Universe 的预注释数据集 并在您自己的自定义模型开发管道中利用它们。我们在 Roboflow Universe 和我们的 LuxonisTrain 框架之间构建了一个无缝的集成。本指南将介绍该过程的主要步骤。有关更实际的示例,请参阅 我们的 Colab 教程

用法

数据集选择

首先访问 Roboflow Universe 并搜索与您的任务相关的数据集。在搜索栏中输入相关关键字即可返回大量数据集供您探索。选择数据集时,请考虑以下几点:
  • 注释类型必须与您的预测目标匹配:对于对象检测模型,数据集必须包含边界框注释。对于实例分割,注释除了边界框外还必须包含每个对象的掩码。对于其他类型的任务也是如此。
  • 数据集质量很重要:确保注释准确,图像内容多样,并且数据集足够大。我们通常建议至少 500-1000 张图像才能获得稳健的性能——但越多越好。
  • 图像域应与您的部署环境匹配:训练图像应与您的模型在生产环境中将看到的图像相似。例如,如果您的工厂只使用蓝色 PCB,但数据集包含绿色 PCB,则可能无法很好地泛化。您可以尝试使用颜色增强来帮助处理这种域转移,或者搜索更适合您部署的数据集。

训练

选择数据集后,您可以在 LuxonisTrain 配置文件 中引用它。需要设置的关键参数是 loader 部分下的 params 中的 dataset_dir我们为 Roboflow 数据集使用特殊的 URI 格式:
Markdown
1roboflow://<TEAM_NAME>/<DATASET_NAME>/<DATASET_VERSION>/coco
您可以直接从数据集 URL 中提取这些组件。例如,对于此数据集:
Markdown
1https://universe.roboflow.com/learn-uzoux/pcb-defect-0i1a7
相应的 dataset_dir 为:
Markdown
1roboflow://learn-uzoux/pcb-defect-0i1a7/2/coco
正确指定数据集后,您就可以开始训练了。您可以通过我们的 Colab 教程 继续完成其余步骤——训练、验证和部署。

后续步骤

如果在初始训练后模型的性能不令人满意,请考虑调整配置——例如,训练更多轮次、使用更大的架构或调整超参数。然而,通常最好的改进来自于添加更多高质量的数据。Roboflow 可以轻松地分叉现有数据集、合并新图像以及在需要时重新注释。如果数据集是私有的,请记住在训练前重新导出您的 API 密钥(如上所述)。