此页面由 AI 自动翻译。查看英文原版
平台

本页目录

  • RVC2 性能
  • RVC2 NN 性能
  • NN 性能估算
  • 功耗
  • 硬件模块和加速器

Robotics Vision Core 2 (RVC2)

Robotics Vision Core 2 (简称 RVC2) 是我们的 RVC 系列的第二代产品。Series 2 OAK 设备以及我们最初的设备都构建在 RVC2 之上。RVC2 包含两个主要组件:
  • 针对特定 SoC 进行微调的DepthAI 功能
  • 一个高性能 SoC 及其所有支持电路(HS PCB 布局、电源输送网络、高效散热等)

RVC2 性能

RVC2 NN 性能

点击此处 查看包含 81 个测试结果的完整表格。
模型名称尺寸FPS延迟 [ms]
ResNet-50224x22426.556.5
MobileOne S0224x224165.511.1
Resnet18224x22594.819.7
DeepLab V3256 x 25636.548.1
DeepLab V3513 x 5136.3253.1
YOLOv6n R2416x41665.529.3
YOLOv6n R2640x64029.366.4
YOLOv6t R2416x41635.854.1
YOLOv6t R2640x64014.2133.6
YOLOv6m R2416x4168.6190.2
YOLOv7t416x41646.737.6
YOLOv7t640x64017.897.0
YOLOv8n416x41631.356.9
YOLOv8n640x64014.3123.6
YOLOv8s416x41615.2111.9
YOLOv8m416x4166.0273.8
YOLOv9t416x41621.7046.09
YOLOv9t640x64010.6993.60
YOLOv9s416x41612.7478.49
YOLOv9m416x4164.71212.31
YOLOv10n416x41627.0736.95
YOLOv10n640x64012.6279.21
YOLOv10s416x41614.0371.29
YOLOv10m416x4166.05165.26
YOLO11n416x41628.0835.61
YOLO11n640x64012.8078.11
YOLO11s416x41612.1782.14
YOLO11m416x4163.90256.20
模型已编译为 8 个 shave,并使用了 2 个 NN 推理线程。延迟包括通过 USB3 从设备获取结果的时间。对每个模型运行了 5 次迭代,并计算了平均 FPS。

NN 性能估算

您可以在下面的图表中估算模型的性能。它包含基于 FLOPs 和参数的 RVC2 上模型的 FPS 估算。
RVC2 NN performance
点击图片查看常见模型 FPS 的更详细评估。

功耗

RVC2 本身的最高功耗约为 4.5W,主要由集成在 RVC2 内的 SoC Movidius Myriad X 消耗。

硬件模块和加速器

SoC 集成了多个硬件加速器,DepthAI API 的设计旨在充分利用它们:
  • 2 个 Leon CPU 核心
    • Leon CSS 处理:USB/以太网堆栈(由 XLink 框架管理)、IMU、3A 算法。减少 CSS CPU 消耗的一种方法是降低 3A 的速率,目前是通过降低相机 FPS 来实现。我们还在尝试跳过某些帧的 3A(例如,每 3 帧运行一次 3A)。在 POE 型号上,CSS CPU 消耗更高,因为它运行以太网堆栈。
    • Leon MSS 处理其他所有事务;调度硬件加速功能、使用 shave 等。
  • ISP - 图像信号处理器,用于图像处理,如降噪、锐化等。整个 ISP 配置通过 ColorCamera 节点MonoCamera 节点 通过 API 公开。
  • 2 个 NCE(神经网络计算引擎)专为一系列操作/层而设计,但有些层未实现,这些层在 SHAVE 核心上实现。
  • 16 个 SHAVE 核心 - 矢量处理器。用于执行某些 NN 操作/层,它们用途广泛,也可用于其他任务,如计算机视觉算法(重新格式化图像、执行某些 ISP 操作等)。
    • 分辨率越高,消耗的 SHAVE 越多;1080P 使用 3 个 SHAVE,4K 使用 6 个 SHAVE。
    • DepthAI 内部的资源管理器协调 SHAVE 的使用,并在给定管道配置请求过多资源时发出警告。
  • 20 个 CMX 切片 - 这些是用于临时存储计算结果的快速 SRAM 内存块(每个 128kB)。它们用于 NN 模型、相机 ISP(1080P 及以下使用 3 个 CMX 切片)、图像处理等。请注意,有 4 个 CMX 切片是预分配的,因此只有 16 个可用。
  • 立体声管道 - 用于立体匹配(Census 变换、成本匹配和成本聚合),由 StereoDepth 节点 使用。
  • 视频编码器,支持 MJPEG、H264 和 H265 编解码器。由 VideoEncoder 节点 使用。
  • 视觉模块
您可以通过启用 调试信息 来检查 SHAVE 和 CMX。