科大讯飞日前在澳门发布旗下首款 AI 眼镜。这款整机重量仅为 40 克的智能穿戴设备没有在像素、全彩大屏或时尚联名上做文章,而是将核心能力押注在翻译功能上。但翻译只是入口,该公司希望通过这副眼镜构建更完整的 AI 工作流。
当前 AI 眼镜市场竞争激烈:2026 年尚未过半,已有超过 30 款产品亮相,参与者包括华为、阿里千问、Rokid、雷鸟、小米等,甚至老板电器和京东方也分别推出了烹饪眼镜和骑行眼镜。然而,在“百镜齐放”的背后,一个容易被忽视的数据是——主流电商平台上 AI 眼镜的退货率普遍在 30% 左右,直播渠道因冲动消费比例更高,退货率可飙至 40%–50%。用户因新鲜感下单,几天后便退货,反映出许多产品未能回答“戴上它到底能帮我干什么”这个核心问题。
40 克:一道系统工程题
讯飞 AI 眼镜集成了微型显示屏、摄像头、5+1 麦克风矩阵、喇叭等部件,但整机重量被控制在 40 克。横向对比:Meta Ray-Ban 为 49 克且无显示屏,Rokid Glasses 同为 49 克但带显示,华为 AI 眼镜 35.5 克却没有显示屏。在“带显示屏”的智能眼镜阵营里,讯飞几乎做到了行业最轻。
为什么必须是 40 克?科大讯飞穿戴设备业务部总经理林会杰表示,亚洲人的颅骨结构和鼻梁高度对重量极为敏感,团队通过模拟仿真与海量调研锁定了这一目标。为了抠出这几克,工程团队在供应链上反复磨合,最关键的一步是采用树脂镜片替代传统的玻璃镜片。智能眼镜的镜片需要做“全贴合”工艺,树脂材料在成型和加热时易产生微小气泡,良率控制远难于玻璃。讯飞据称是行业首个在带显示的智能眼镜上跑通全贴合树脂工艺的厂商,单此一项便使镜片重量比玻璃方案降低 30%–40%。此外,定制的 0.15CC 微型光机、微型摄像头模组以及软硬深度耦合的芯片选型,都为实现 40 克机身提供了支撑。
从翻译到 AI 工作流
讯飞做 AI 眼镜的起点,来自对翻译机用户痛点的长期观察。副总裁王玮指出,翻译机在展会、商务洽谈等场景中很实用,但用户在国外旅游或某些场合时,不便掏出设备或低头看屏幕,希望交流是“沉浸式”的,翻译像空气一样自然存在。这种“物理中断”的体验痛点,推动讯飞从耳机到眼镜布局穿戴式翻译。
讯飞在翻译领域的积累不可忽视:翻译机累计售出 100 万台、翻译 10 亿次;讯飞同传跑过 42 万场国际会议,覆盖 50 多个国家,连续 8 年服务全国两会。去年 10 月推出的翻译耳机验证了两个关键点:用户确实需要释放双手的穿戴式翻译,端到端同传在穿戴设备上响应速度可控制在 2 秒以内。但耳机仅覆盖听觉,眼镜增加了视觉模态——摄像头可拍照翻译,显示屏能投射字幕,更多麦克风实现定向降噪。
唇动识别降噪
讯飞此次首发“唇动识别降噪”技术。眼镜的前置摄像头可以锁定对面说话人的嘴唇动作,配合 5 颗气导麦克风与 1 颗骨传导麦克风组成的六通道音频流,系统实时通过“看到谁的嘴在动”辅助判断“该听谁的声音”,从而在嘈杂的多人混声中精准提取目标人物的语音,实现“看谁翻谁”的效果。该技术直接提升了翻译的前端音频质量,安静环境下现有翻译软硬件已能较好处理,而复杂场景正是讯飞希望借助眼镜的视觉模态攻克的方向。
讯飞 AI 眼镜还搭载了端到端的语音同传大模型,跳过文本转译步骤,直接实现“语音进、语音出”,首字响应时间压进 2 秒以内,云端撑腰的是星火 X2 模型。在 2026 年供应链成本下降、国家补贴首次纳入智能眼镜的背景下,讯飞选择了这一节点进入市场。正如王玮所说:“眼镜离人的眼睛、耳朵、嘴巴最近,它是物理世界与数字世界天然的桥梁。”
本文参考来源:爱范儿
微信扫描下方的二维码阅读本文

