此页面由 AI 自动翻译。查看英文原版

本页目录

  • 概述
  • 通用示例
  • 自定义示例

OAK 示例

概述

OAK 示例 是一系列推理示例,可用作您自己应用程序的起点或灵感来源。 这些示例利用了 推理 部分中介绍的概念, 并在 OAK 设备上运行实时 AI 推理。 我们建议您首先探索 通用示例,然后继续探索我们为各种 ML 任务准备的众多 自定义示例

通用示例

通用示例 运行一个简单的推理管道,该管道使用单个头模型对单个图像输入进行预测。 例如,您可以运行 YOLOv6 对象检测,如下所示:
Python
1python3 main.py --model luxonis/yolov6-nano:r2-coco-512x288

自定义示例

我们还提供各种各样的 自定义示例。,演示了包含多个模型(可能具有多个头)和/或自定义输出处理的管道的使用。 这些示例涵盖了广泛的 ML 任务,包括:
  • 分类 分配标签,例如识别图像中的对象(例如,猫与狗);
  • 对象检测 识别和定位图像中的多个对象;
  • 人脸检测 分析面部特征、表情和行为;
  • 3D 检测 将对象检测扩展到 3D 空间,估计对象的位置、大小和方向;
  • 关键点检测 检测对象内的特定兴趣点(例如,面部地标);
  • 姿态估计 分析人体或动物的身体,预测关节位置和姿势;
  • 分割 根据类别标记每个像素(例如,对象与背景);
  • 对象跟踪 跟踪同一场景中一系列图像中各个对象的移动;
  • 计数 计算图像中的对象数量(例如,人群中的人数);
  • 光学字符识别 从图像中提取文本,将其转换为机器可读文本;
  • 重识别 匹配和识别不同场景图像中的各个对象;
  • 深度估计 预测对象与摄像机的距离,创建场景的深度图;
  • 线检测 识别图像中的线条或边缘(例如,自动驾驶中的车道检测);
  • 图像到图像翻译 将图像从一种格式转换为另一种格式(例如,增强分辨率);
  • 特征检测 识别图像中的关键特征或点,用于图像匹配等任务;
  • 语音识别 通过分析音频信号将口语转换为文本。
我们在下面展示了一些示例,但请务必在 GitHub 上查看完整集合。
QR Code Reader
QR Code Reader
QR Code Reader
QR Code Reader
QR Code Reader
QR Code Reader