终于清楚嘉楠科技发布高性能图像及语音处理 AI 芯片勘智 K510：RISC-V 双核 64 位 CPU，支持高清航拍等 - 最新消息

最新消息 7 月 8 日消息嘉楠科技正式发布 AI 芯片勘智 K510。该芯片定位于中高端边缘推理市场，搭载自主研发 IP 核的升级版本，采用独创计算数据流与复用方式，在算力提升 3 倍的同时降低芯片功耗。K510 集成新一代图像处理单元，搭载 3D ISP，支持 TOF 深度摄像头，以及 2D/3D 降噪、WDR 宽动态、鱼眼矫正和硬件 3A 等功能。在应用方面，K510 支持高清视频会议、高清航拍和机器人等边缘侧场景。

最新消息获悉，官方介绍，K510 在总线架构、IP 核心与视频子系统推出全新设计，相比一代芯片算力提升 3 倍，经典视觉算法大幅度优化，自研高速 PHY 接口理论带宽 10GB/s，8 位数据压缩率 50% 以上，极大优化了勘智 AI 系列在机器视觉场景的应用性能。

总线结构是一款 SoC 的主要特征。为了解决 SoC 总线地址空间有限以及芯片受单一时钟的影响，嘉楠科技在 NoC 总线架构中设计了可扩展的地址空间，使每个 IP 核工作在特定的时钟域。

根据相关性，K510 将系统时钟结构划分成多个时钟域，从而解决分状态时钟控制问题。把整个系统划分成多个可支持上下电操作的电源域，从而解决了分区域控制能耗问题。

在 ISA 方面，K510 沿用 RISC-V 双核 64 位 CPU 架构，并集成了数字信号处理器 DSP 来辅助加速 AI 应用。不同的是，嘉楠科技为 DSP 设计了专用的片上存储，并且在双核 CPU 与 DSP 之间加入 mailbox 通信模块，以实现对系统各部分的灵活调度。

K510 自主研发 IP 核融合了嘉楠科技在算法、软硬件和编译器的最新设计，集中突破 AI 芯片设计中广泛存在的“存储墙”和“性能墙”的问题。

首先是“存储墙”，计算过程需要把数据从存储器搬运到处理器才能进行运算。而存储器的吞吐性能往往滞后于处理器的性能增长，直接影响了计算效率的提升。嘉楠科技在中采用了全局本地缓存设计，通过 SRAM 阵列满足神经网络中不同层级对内部访问带宽和存储的需求。

其次是“性能墙”，为了提升计算效率，采用了动态 3D PE 阵列。第三个维度支持多种方式共享传递数据，并实现多个维度上的计算映射，提高 PE 阵列的利用率。同时也可以动态开启或关闭每一个 2D 阵列，并根据不同层级对带宽和计算资源的需求进行调整。

结合动态 3D PE 计算阵列和灵活的全局本地访存设计，嘉楠科技提出的计算数据流，计算卷积不需要进行 im2col（image to column）数据重排，提升计算效率；而通过多级存储设计，K510 可以增加卷积计算的数据复用，从而减少数据的读取次数，降低芯片功耗。

同时，还搭载了可重构的 SIMD 加速单元，通过创新的 meshnet 网络可以灵活配置支持各种激活函数、pooling 和 resize 等算子。

K510 搭载的高速 PHY 接口由嘉楠科技自主研发。LPDDR4 支持 32 位双通道，最高频率 2700MHz，理论最大带宽 10GB/s。MIPI D-PHY spec , 支持 4 通道输入，每通道峰值速率达。

与第一代芯片相比，K510 在帧率和外设方面都有大幅优化。此外，K510 还支持浮点 BF16 计算，在不适合进行模型量化的场景相比同类产品更具优势。

在外设方面，K510 搭载 MIPI CSI2 和 DVP 接口，可同时支持最多 3 个摄像头输入。MIPI CSI 接口支持 1x4 lane 和 2x2 lane 模式，灵活支持各种 MIPI 摄像头。K510 MIPI 支持 DPHY 标准，最高速率每 lane 可达，支持 RAW, RGB, YUV 等各种流行格式。

K510 内部还集成了 3 个图像处理单元 ISP, 其中一个 ISP 支持 3D 功能，无需软件参与，直接依靠硬件完成深度数据的提取加工，相比软件处理深度信息方式不但节省了巨大的 CPU 开销，性能上也会有很大提升。

为进一步提高芯片对算法模型的适配，嘉楠科技在 K510 的编译器和软件上联合优化带宽需求，对算法进行量化压缩。

K510 在设计上针对中间层数据和权重的分布特性采用不同的压缩算法。针对中间层计算数据，利用相邻数据的相关性进行无损压缩，即便 8 位数据的平均压缩率也能达到 50% 以上，并且基本不损失精度；对权重数据则采用稀疏压缩，在网络进行稀疏训练的情况下，压缩率也可以到 50% 以上。

在软件方面，K510 支持丰富的网络模型算子，包括常见的 CNN、RNN 和各类向量计算和数据处理操作。支持裸机、嵌入式 RTOS 和 Linux，并且移植了 OpenCV Python Numpy。同时，K510 支持 TensorFlow、PyTorch、onNX 和 TVM 等主流深度学习框架，兼容性更强。

得益于架构优化和高清 MIPI 的强大配置，K510 支持 2~3 路 2K 显示和 VPU 图像拼接，以及业内最前沿的 TOF VSLAM 视觉导航技术，快速实现对障碍物的测距和避障，可用于无人机航拍、高清视频会议和机器人等多个场景。

热门水果蔬菜

热门畜牧水产

热门粮油米面

热门农副加工

热门苗木花草

热门农资农机