此页面由 AI 自动翻译。查看英文原版

本页目录

  • 概述
  • 数据目录
  • 准备您的数据
  • LuxonisDataset

数据准备

概述

LuxonisTrain 支持多种数据加载方法,可灵活使用不同的数据集格式。 以下是支持的选项:
  1. 数据目录: 使用一种受支持结构的格式化数据目录。有关更多详细信息,请参阅 LuxonisParser
  2. LuxonisDataset 格式: 使用自定义 LuxonisDataset 格式的现有数据集。有关进一步的指导,请参阅 LuxonisDataset 文档。
  3. 自定义加载器: 实现自定义加载器以满足特定的数据处理需求。要了解如何创建和使用自定义加载器,请访问 自定义 部分。

数据目录

准备您的数据

要使用 LuxonisParser 工具,您需要将数据集准备成一种受支持的源结构。
  1. 将数据集组织成受支持的格式之一。
  2. 将数据集放在训练脚本可访问的目录中。
  3. 在配置文件中更新 dataset_dir 参数,使其指向数据集目录。
dataset_dir 可以是以下之一:
  • 数据集目录的本地路径
  • 远程数据集的 URL: 数据集将下载到当前工作目录的“data”目录中。
支持的 URL 协议:
  • s3://bucket/path/to/directory 用于 AWS S3
  • gs://bucket/path/to/directory 用于 Google Cloud Storage
  • roboflow://workspace/project/version/format 用于 Roboflow
    • workspace: 数据集所属工作区的名称。
    • project: 数据集所属项目的名称。
    • version: 数据集的版本。
    • format: cocodarknetvocyolov4pytorchmt-yolov6createmltensorflowfolderpng-mask-semantic 之一。
示例:
Yaml
1loader:
2  params:
3    dataset_name: "coco_test"
4    dataset_dir: "roboflow://team-roboflow/coco-128/2/coco"

LuxonisDataset

要使用 LuxonisDataset 作为数据源,请在配置文件中指定以下内容:
Yaml
1loader:
2  params:
3    # 数据集名称
4    dataset_name: "dataset_name"
5
6    # 存储类型:'local'(默认)、's3' 或 'gcs' 之一
7    bucket_storage: "local"
您可以使用 inspect 命令来检查加载器输出。inspect 命令显示数据集中图像及其对应的注释。
Command Line
1luxonis_train inspect --config configs/detection_light_model.yaml
inspect 目前仅在 CLI 中可用。