此页面由 AI 自动翻译。查看英文原版

OAK 应用

DepthAI

概览
DepthAI 组件
示例
高级教程
API 参考
ROS
工具
发行说明

AI

软件栈

Luxonis OS

故障排除

OAK 示例

概述

OAK 示例是一系列推理示例，可用作您自己应用程序的起点或灵感来源。这些示例利用了推理部分中介绍的概念，并在 OAK 设备上运行实时 AI 推理。我们建议您首先探索通用示例，然后继续探索我们为各种 ML 任务准备的众多自定义示例。

通用示例

通用示例运行一个简单的推理管道，该管道使用单个头模型对单个图像输入进行预测。例如，您可以运行 YOLOv6 对象检测，如下所示：

Python

1python3 main.py --model luxonis/yolov6-nano:r2-coco-512x288

自定义示例

我们还提供各种各样的自定义示例。，演示了包含多个模型（可能具有多个头）和/或自定义输出处理的管道的使用。这些示例涵盖了广泛的 ML 任务，包括：

分类：分配标签，例如识别图像中的对象（例如，猫与狗）；
对象检测：识别和定位图像中的多个对象；
人脸检测：分析面部特征、表情和行为；
3D 检测：将对象检测扩展到 3D 空间，估计对象的位置、大小和方向；
关键点检测：检测对象内的特定兴趣点（例如，面部地标）；
姿态估计：分析人体或动物的身体，预测关节位置和姿势；
分割：根据类别标记每个像素（例如，对象与背景）；
对象跟踪：跟踪同一场景中一系列图像中各个对象的移动；
计数：计算图像中的对象数量（例如，人群中的人数）；
光学字符识别：从图像中提取文本，将其转换为机器可读文本；
重识别：匹配和识别不同场景图像中的各个对象；
深度估计：预测对象与摄像机的距离，创建场景的深度图；
线检测：识别图像中的线条或边缘（例如，自动驾驶中的车道检测）；
图像到图像翻译：将图像从一种格式转换为另一种格式（例如，增强分辨率）；
特征检测：识别图像中的关键特征或点，用于图像匹配等任务；
语音识别：通过分析音频信号将口语转换为文本。

我们在下面展示了一些示例，但请务必在 GitHub 上查看完整集合。

QR Code Reader

QR Code Reader

QR Code Reader

QR Code Reader

QR Code Reader

QR Code Reader