Robotics Vision Core 4 (RVC4)

Robotics Vision Core 4（简称 RVC4）是我们 RVC 的第四代产品。主要规格：

6 核 ARMv8 CPU，运行 Linux
AI：48 INT8，12 FP16 TOPS
GPU：4 FP16 TOPS
计算机视觉：立体深度、帧变形引擎、光流、特征检测、描述符匹配、模板匹配
ISP：5 个摄像头流，HDR，EIS，3A
编码：4K @ 240FPS 解码，H264 和 H265 的 4K @ 120FPS 编码。还支持 VP9、AV1 解码

要保持最新，请考虑订阅 RVC4 新闻通讯。

计算机视觉引擎

立体深度：最大 800P @ 60FPS，默认 4 位子像素，64 视差搜索。8 位置信度图，空间一致性，遮挡和纹理掩码，±3 像素线校正容差
- 最大立体分辨率为 1280x1280
图像变形引擎：吞吐量 1080P @ 240FPS
光流：半密集：1080P @ 60FPS，全密集：VGA @ 60 FPS
特征检测：Harris 角点检测，1080P @ 60FPS
描述符匹配：ORB 计算和内联匹配。描述符：256 位。最大 1080P，每 500 个描述符 1ms（计算 + 匹配）
模板匹配：最大 1080P，500 个模板 1.2ms，每帧最多 1024 个块

图像信号处理器

RVC4 的图像信号处理器 (ISP) 具有以下功能：

最多 3 个并发摄像头流（带 ISP 处理）
- 3x 36MP @ 30FPS 或
- 1x 36MP + 1x 72MP @ 30FPS 或
- 1x 108MP @ 30FPS
最多 2 个额外的原始输出流（无 ISP 处理）
3A（自动曝光、自动白平衡、自动对焦）
支持 18 bpp（每像素位数）
硬件 HDR：交错式 HDR，数字重叠，无重叠
图像稳定 (EIS)，良好的低光性能

AI

RVC4 NN 模型基准测试（峰值性能）：

模型名称	大小	FPS	任务
YoloV5m	640x640	280	对象检测
YoloV6n	512x288	2340	对象检测
YoloV7-W6	640x640	162	对象检测
ResNet-50	224x224	934	分类
ViT-Tiny	224x224	650	分类
BiSeNetv1-MBNV2	512x228	647	语义分割
eWaSR	512x384	309	语义分割

AI 功耗

RVC4 的 AI 系统设计为节能且可根据用户需求进行配置。AI 系统可以配置为在不同的功率级别（FPS 速度）下运行，这将影响 AI 系统的性能。下表显示了不同 FPS 速度下的模型 FPS 和[功耗]：

模型名称	低 FPS	中 FPS	高 FPS	最大 FPS
BiSeNet-MBNV2 (512x288)	80 [0.67 W]	133 [1.04 W]	391 [3.02 W]	647 [5 W]
eWaSR ResNet18 (512x384)	59 [0.79 W]	106 [1.51 W]	229 [3.55 W]	309 [5.25 W]
MobileVit-xxs (224x224)	104 [0.63 W]	199 [1 W]	277 [1.82 W]	488 [3.27 W]
Repvgg_a2 (224x224)	181 [1.07 W]	327 [2.22 W]	466 [3.75 W]	1250 [10.4 W]
ResNet101 (224x224)	115 [1.05 W]	243 [2.4 W]	339 [3.57 W]	718 [8.62 W]
ResNet50-v2-7 (224x224)	145 [0.96 W]	260 [1.9 W]	380 [2.83 W]	934 [7.65 W]
ViT-Tiny patch16 (224x224)	124 [0.7 W]	228 [1.25 W]	300 [1.88 W]	615 [4.27 W]
Yolo6N (512x288)	190 [0.7 W]	307 [1.1 W]	702 [3.8 W]	2340 [7.5 W]
YoloV5M (640x640)	48 [0.93 W]	72 [1.75 W]	212 [6.05 W]	280 [8.4 W]
YoloV7-W6 (640x640)	34 [1.05 W]	60 [2.48 W]	139 [7.45 W]	162 [7.85 W]

功耗测量是在 10 秒推理运行期间对整个 RVC4 板进行的。因此，AI 功耗会略低一些，因为芯片的其余部分（主要是 CPU）也在消耗功率。

请注意，最大 FPS 值是在 RVC4 的峰值性能下记录的。在大多数用例中，RVC4 会降频以避免过热。

Jetson 对比

Nvidia 的 Jetson 系列目前是事实上的边缘 AI 平台。我们测试了 Jetson Orin Nano 8GB（标准版，非 Super 版），它具有 40 TOPS（GPU）和 6 核 ARM CPU。下面是 RVC4 与 Jetson Orin Nano 8GB 的 1:1 对比，两者都使用 INT8 精度和相同的图像形状：

模型名称	RVC4 [FPS]	Jetson Orin Nano 8GB [FPS]
InceptionV4, BS1	691	170
InceptionV4, BS32	608	358
ResNet50, BS1	1369	502
ResNet50, BS32	1644	1191
VGG19, BS1	269	183
VGG19, BS32	560	362
Super Resolution, BS1	36*	202
SSD MobileNet V1, BS1	1910	920
SSD MobileNet V1, BS32	2688	2260
UNet Segmentation, BS1	323	142
YoloV3 Tiny, BS1	1342	563

查看 Jetson 系列基准测试（底部），Nvidia 报告了 BS32 模型（批处理大小为 32，即一次推断 32 张图像）的 FPS。根据我们自己的测试，这些数字是现实的，但是，它们的 BS1 模型（批处理大小为 1，即单张图像）的性能比 BS32 模型差约 2 倍。如果您想要实时性能（延迟不超过 1 秒），则需要使用 BS1 模型。* 由于 SoC 是全新的，模型优化器仍在更新中，未来将添加更多层以在加速块上进行处理。对于超分辨率模型，有几层是在 CPU 上处理的。这就是 RVC4 性能较低的原因。

功耗效率

我们还测量了 RVC4 和 Jetson Orin Nano 8GB 的功耗。我们将两个设备都运行在最大性能模式下（即 RVC4 的最大 FPS），并测量了整个板的功耗。Orin Nano 的功耗波动很大，因此我们取了 10 秒内的平均功耗。我们始终使用批处理大小为 1 的模型（即单张图像）。

模型名称	RVC4 [W]	Jetson Orin Nano 8GB [W]
InceptionV4	9.1	12
ResNet50	10.2	13
VGG19	9.5	11
YoloV3 Tiny	9.9	10
YoloV5 M (416x416)	9.3	11

结论： RVC4 的速度比 Jetson Orin Nano 8GB 快 1.9 倍，同时功耗效率也高 15%。

自定义应用

用户可以完全访问 RVC4 的强大功能：

可通过 Luxonis Hub 开箱即用地轻松开发和部署自定义容器化应用
使用 Halide 在加速硬件块之上开发和运行快速计算机视觉管道
与 GPIO 和通信接口进行交互
由于 RVC4 还可以选择作为主机计算机运行，因此可以将其连接到其他基于 RVC2 的 OAK (PoE) 摄像头。

功耗

RVC4 本身的最大功耗峰值约为 25W，这主要由集成在 RVC4 内部的 SoC（高通 QCS8550）消耗。

最大峰值：25W
最大平均值：10-15W
平均空闲：1.6W
启动峰值：12W
启动平均值：2.3W（约 15 秒）

本页目录