2026 年 1 月,韩国图像处理 IP 提供商 Chips&Media 与以色列低光图像处理初创公司 Visionary.ai 联合宣布,开发出全球首款全 AI 基图像信号处理器(ISP),该产品已在 CES 2026 正式亮相,标志着数字成像领域从硬件固化向软件定义的结构性转变。
Chips&Media 作为资深硬件 IP 供应商,其核心技术支撑来自 WAVE-N 系列定制 NPU。最新的 WAVE-N V2 版本支持 16 位浮点运算,MAC 利用率高达 90%,专为边缘设备的高分辨率实时图像处理优化。该公司在视频编解码领域积累深厚,其 WAVE5/6 系列 IP 支持 8K30fps@500MHz 处理能力,具备 3D 降噪等基础图像处理功能。

Visionary.ai 则以低光成像技术见长,曾入选 CB Insights 全球最具前景 AI 初创企业榜单,其核心优势在于端到端神经成像 pipeline 与自动化模型训练平台。两家企业的合作实现了 “硬件算力优化 + 算法模型创新” 的互补,针对性解决传统 ISP 在多场景适配中的性能瓶颈。
技术架构:从硬件固定到软件定义的革新
核心突破:全链路 NPU 替代硬件 ISP
传统 ISP 依赖固定硬件架构执行数学运算流程,从黑电平校正到色彩矩阵转换的各环节均由物理电路实现,仅能通过出厂后手动传感器调校微调,适配新传感器的周期通常长达数月。Chips&Media 与 Visionary.ai 的方案则实现了根本性变革 —— 直接在 NPU 或 GPU 上对 RAW 传感器数据进行端到端处理,完全剥离对硬件 ISP 的依赖。
Visionary.ai CEO Oren Debbi 强调,这一架构与现有 “硬件 ISP+AI 模块” 的混合方案存在本质区别:“传统方案中神经网络仅作为辅助工具,而我们的 pipeline 以神经处理为核心,仅保留曝光、白平衡等基础相机控制功能的传统实现方式。” 这种设计使成像系统可通过 OTA 更新持续优化,无需改动硬件芯片。
传感器适配:自动化训练的效率革命
该方案的关键支撑是传感器定制化训练体系。Visionary.ai 开发的自动化平台仅需 5 个短视频片段用于训练、2 个用于验证,即可在数小时内生成适配特定传感器的 AI 模型。这一流程相比传统 ISP 平均 30 天的定制周期,将集成成本降低了 90% 以上,解决了多传感器适配的规模化难题。
训练过程基于元学习框架与自监督预训练技术,通过 3D CNN+Transformer 架构捕捉图像时空特征,无需大量人工标注数据。在 UCF101 数据集测试中,该训练体系支撑的模型在行为识别任务中准确率达 98.2%,验证了其算法的鲁棒性。
核心性能:极端场景的数据表现
低光成像:突破物理光照限制
低光环境是该 AI ISP 的优势场景。其在 0.1 lux 的极端低光条件下仍能保持清晰成像,相比传统 ISP 实现了 100% 的信噪比(SNR)提升,检测准确率提高 75%,同时将误报率降低 91%。这种表现源于端到端优化带来的性能突破 —— 传统 ISP 需在降噪与细节保留间妥协,常导致图像出现蜡质纹理或光晕 artifacts,而 AI 模型可通过全局优化实现 “降噪 - 保细节” 的平衡。
在隧道出入口等高低动态范围场景中,该方案通过多帧融合算法减少 ghosting 与闪烁现象,同时保持自然细节。实测数据显示,其处理的视频在 PSNR(峰值信噪比)指标上比传统 ISP 平均提升 4.2dB,这一数值已超越多数非实时图像处理方案。
实时处理与功耗平衡
尽管基于 AI 运算,该方案通过硬件优化实现了高效能表现。依托 Chips&Media WAVE-N NPU 的架构优势,系统可在边缘设备上实现 4K 120fps 的实时处理,功耗仅略高于传统硬件 ISP。WAVE-N V2 的 16 位浮点运算支持与 90% MAC 利用率,使其在相同算力下比通用 NPU 降低 30% 功耗。
厂商提供的功耗测试数据显示,在 1080p 60fps 处理场景下,该 AI ISP 的功耗约为 2.3W,接近传统 ISP 的 2.1W 水平。随着 NPU 硬件迭代与模型优化,这一差距仍在缩小。
落地条件:功耗控制与硬件适配
硬件兼容性:跨平台部署能力
该方案具备硬件 agnostic 特性,可适配不同厂商的 NPU 与 GPU,无需绑定特定 SoC 架构。Chips&Media 的 WAVE-N NPU 作为参考实现,已验证其在视频专用 AI 硬件上的实时运行能力,而厂商可根据成本与功耗需求选择适配的处理单元。
对于已量产的芯片,Visionary.ai 可通过纯软件集成在数月内完成部署;针对预流片阶段的芯片,则可通过缩减 ISP 硬件面积降低制造成本。这种灵活适配能力使其可覆盖智能手机、自动驾驶、XR 设备等多类终端。
行业适配:聚焦视频场景的应用落地
目前方案的核心目标场景集中在视频处理领域,包括汽车夜间驾驶、视频会议等。这些场景对实时性与低光表现的需求,与 AI ISP 的技术优势高度匹配。在汽车电子场景中,其高动态范围处理能力可提升夜间行车的障碍物检测距离,配合 8MP 分辨率支持,满足 L4 级自动驾驶的视觉需求。
对于仍以静态摄影为主的单反相机领域,厂商表示技术架构具备适配潜力,但需等待市场需求驱动。而在工业检测场景中,该方案已展现出实用价值 —— 在半导体晶圆检测中,其缺陷检出率达 99.3%,误报率降至 0.02%,超越传统视觉系统表现。
