DepthAI v2 has been superseded by DepthAI v3. You are viewing legacy documentation.
此页面由 AI 自动翻译。查看英文原版

本页目录

  • 快速入门
  • 概述
  • 特征
  • 安装
  • 可用模型
  • 示例
  • 有用技巧

DataDreamer

DataDreamer 示例

快速入门

DataDreamer 使您能够使用生成式 AI 和基础计算机视觉模型从头开始创建带注释的数据集。这使您能够为边缘 AI 应用(例如对象检测)训练自己的模型,而无需真实世界数据。要使用自定义类生成数据集,您只需执行两个命令:
Command Line
1pip install datadreamer
2datadreamer --class_names person moon robot

概述

DataDreamer 方案
DataDreamer 是一个先进的工具包,旨在促进边缘 AI 模型的开发,无论初始数据是否可用。DataDreamer 的独特功能包括:
  • 合成数据生成:消除对 AI 训练所需的大量数据集的依赖。DataDreamer 使用能够生成高质量、多样化图像的高级 AI 算法,使用户能够从头开始生成合成数据集。
  • 从基础模型中提取知识DataDreamer 利用嵌入在复杂、预训练 AI 模型中的潜在知识。此功能允许将广泛的理解从这些“基础模型”转移到更小的、定制构建的模型,从而显著增强它们的功能。
  • 高效且强大的模型DataDreamer 的主要目标是能够创建紧凑的模型,这些模型在尺寸上易于集成到任何设备中,并且在性能上对于专用任务来说非常强大。

特征

  • 提示生成:使用强大的语言模型自动创建图像提示。提供的类名: ["horse", "robot"]生成的提示:“一张马和机器人平静地共存于宁静牧场中的照片。”
  • 图像生成:使用最先进的生成模型生成合成数据集。
生成的图像
  • 数据集注释:利用基础模型自动标记数据集。
带注释的图像
  • 边缘模型训练:训练用于边缘部署的高效小型神经网络。(不属于此库)

安装

您可以 下载它 或使用 pip 进行安装:
Command Line
1pip install datadreamer

可用模型

模型类别模型名称描述/备注
提示生成Mistral-7B-Instruct-v0.1语义丰富的提示
TinyLlama-1.1B-Chat-v1.0小型语言模型
简单的随机生成器连接随机选择的对象名称
图像生成SDXL-1.0慢且准确(1024x1024 图像)
SDXL-Turbo快速但不太准确(512x512 图像)
SDXL-Lightning快速且准确(1024x1024 图像)
图像注释OWLv2开放词汇对象检测器

示例

Command Line
1datadreamer --save_dir path/to/save_directory --class_names person moon robot --prompts_number 20 --prompt_generator simple --num_objects_range 1 3 --image_generator sdxl-turbo
此命令为指定的对象生成图像,并将它们及其注释保存在给定目录中。该脚本允许通过各种参数自定义生成过程,以适应不同的需求和硬件配置。

有用技巧

  • 批量生成:为了加快生成过程,请考虑使用 --batch_size_prompt--batch_size_image--batch_size_annotation 参数增加批次大小。如果内存不足,请尝试减小批次大小。
  • 更好的图像质量:为了获得更好的图像质量,请考虑调整以下参数:
    • --image_generator:选择图像质量更高的模型。SDXL-Turbo -> SDXL-Lightning -> SDXL(从最快到最慢,从最低到最高质量)。
    • --use_image_tester--image_tester_patience:启用迭代图像生成,并使用 CLIP 模型选择最佳图像。考虑增加耐心以获得更好的结果。
  • 每张图像的对象数量:要生成具有不同数量对象的图像,请使用 --num_objects_range 参数。例如,--num_objects_range 1 3 生成包含 1、2 或 3 个对象的图像。不建议使用高于 3 的值,因为当前模型生成复杂场景的能力有限。
  • 提示生成:要生成更多样化的提示,请考虑使用 --prompt_generator tiny 生成器,它使用小型语言模型来生成提示。