数据准备

概述

LuxonisTrain 支持多种数据加载方法，可灵活使用不同的数据集格式。以下是支持的选项：

数据目录: 使用一种受支持结构的格式化数据目录。有关更多详细信息，请参阅 LuxonisParser。
LuxonisDataset 格式: 使用自定义 LuxonisDataset 格式的现有数据集。有关进一步的指导，请参阅 LuxonisDataset 文档。
自定义加载器: 实现自定义加载器以满足特定的数据处理需求。要了解如何创建和使用自定义加载器，请访问自定义部分。

要使用 LuxonisParser 工具，您需要将数据集准备成一种受支持的源结构。

dataset_dir 可以是以下之一：

支持的 URL 协议:

s3://bucket/path/to/directory 用于 AWS S3
gs://bucket/path/to/directory 用于 Google Cloud Storage
roboflow://workspace/project/version/format 用于 Roboflow
- workspace: 数据集所属工作区的名称。
- project: 数据集所属项目的名称。
- version: 数据集的版本。
- format: coco、darknet、voc、yolov4pytorch、mt-yolov6、createml、tensorflow、folder 或 png-mask-semantic 之一。

示例:

Yaml

1loader:
2  params:
3    dataset_name: "coco_test"
4    dataset_dir: "roboflow://team-roboflow/coco-128/2/coco"

要使用 LuxonisDataset 作为数据源，请在配置文件中指定以下内容：

Yaml

1loader:
2  params:
3    # 数据集名称
4    dataset_name: "dataset_name"
5
6    # 存储类型：'local'（默认）、's3' 或 'gcs' 之一
7    bucket_storage: "local"

您可以使用 inspect 命令来检查加载器输出。inspect 命令显示数据集中图像及其对应的注释。

Command Line

1luxonis_train inspect --config configs/detection_light_model.yaml

inspect 目前仅在 CLI 中可用。