Roboflow Universe

Supported on:RVC2 RVC4

概述

Roboflow 是一个全面的平台，旨在简化构建、训练和部署计算机视觉模型的过程。其核心功能之一是 Roboflow Universe，这是一个由社区驱动的平台，用户可以在其中共享和探索各种用例的带注释计算机视觉数据集。在此集成中，我们专注于使用来自 Roboflow Universe 的预注释数据集并在您自己的自定义模型开发管道中利用它们。我们在 Roboflow Universe 和我们的 LuxonisTrain 框架之间构建了一个无缝的集成。本指南将介绍该过程的主要步骤。有关更实际的示例，请参阅我们的 Colab 教程。

用法

数据集选择

首先访问 Roboflow Universe 并搜索与您的任务相关的数据集。在搜索栏中输入相关关键字即可返回大量数据集供您探索。选择数据集时，请考虑以下几点：

注释类型必须与您的预测目标匹配：对于对象检测模型，数据集必须包含边界框注释。对于实例分割，注释除了边界框外还必须包含每个对象的掩码。对于其他类型的任务也是如此。
数据集质量很重要：确保注释准确，图像内容多样，并且数据集足够大。我们通常建议至少 500-1000 张图像才能获得稳健的性能——但越多越好。
图像域应与您的部署环境匹配：训练图像应与您的模型在生产环境中将看到的图像相似。例如，如果您的工厂只使用蓝色 PCB，但数据集包含绿色 PCB，则可能无法很好地泛化。您可以尝试使用颜色增强来帮助处理这种域转移，或者搜索更适合您部署的数据集。

训练

选择数据集后，您可以在 LuxonisTrain 配置文件中引用它。需要设置的关键参数是 loader 部分下的 params 中的 dataset_dir。我们为 Roboflow 数据集使用特殊的 URI 格式：

Markdown

1roboflow://<TEAM_NAME>/<DATASET_NAME>/<DATASET_VERSION>/coco

您可以直接从数据集 URL 中提取这些组件。例如，对于此数据集：

Markdown

1https://universe.roboflow.com/learn-uzoux/pcb-defect-0i1a7

相应的 dataset_dir 为：

Markdown

1roboflow://learn-uzoux/pcb-defect-0i1a7/2/coco

如果数据集是您 Roboflow 团队的私有数据集，请务必在开始训练过程之前导出您的 Roboflow API 密钥：export ROBOFLOW_API_KEY="<ADD_YOUR_ROBOFLOW_API_KEY_HERE>"

正确指定数据集后，您就可以开始训练了。您可以通过我们的 Colab 教程继续完成其余步骤——训练、验证和部署。

后续步骤

如果在初始训练后模型的性能不令人满意，请考虑调整配置——例如，训练更多轮次、使用更大的架构或调整超参数。然而，通常最好的改进来自于添加更多高质量的数据。Roboflow 可以轻松地分叉现有数据集、合并新图像以及在需要时重新注释。如果数据集是私有的，请记住在训练前重新导出您的 API 密钥（如上所述）。

本页目录

Roboflow Universe

概述

用法

数据集选择

训练

后续步骤