世界杯(中国) 讯飞首款 AI 眼镜，用 40 克撬动 AI 责任流

来源：未知作者：admin 发布时间：2026-05-29 09:21 浏览：54

太阳城娱乐游戏(SunGame)官网

2026 还没过半，如故有 30 多款 AI 眼镜亮相了。

除了、阿里千问、Rokid、雷鸟、小米这些老玩家，连雇主电器都推出 AI 烹调眼镜，京东方也作念了骑行眼镜……百镜皆放，但大体上在围着三件事卷：谁能作念得更轻、谁的录像头更领略、谁的镜片上能塞进更大更好的炫耀屏。

吵杂之下，有一个数据庸碌会被忽略。

目前主流电商平台上，AI 眼镜的退货率高得惊东说念主，精深在 30% 傍边，在冲动滥用占大头的直播渠说念，退货率以至能飙到 40% 到 50%。

用户因为清新感下单，戴了几天，沉默点了退货。销量高开低走、退货率居高不下，便是广大 AI 眼镜的「人命周期」。

说白了，尝鲜期畴昔后，滥用者就会运转产生这么的猜忌：戴上之后它到底能帮我干什么。

就在今天，科大讯飞在澳门发布了旗下首款 AI 眼镜。这副 40 克的眼镜莫得卷像素、卷全彩大屏、卷前卫联名，把中枢智力押注在一个看起来十分常见的智力上——翻译。

但翻译仅仅它的进口，不是特殊。

发布会前夜，APPSO 和科大讯飞副总裁王玮、衣服建设业务部总司理林会杰聊了聊。聊到后半段，话题从具体的家具技能鼎新到了一个更大的命题上：AI 眼镜下半场的弊端，到底在硬件层面如故在 AI 责任流？

AI 眼镜的「奇点」，是让东说念主快乐一直戴

百镜大战之后，在现存供应链里攒出一款智能眼镜真不难，华强北两周就能给你出一个样机。但难的是，你怎样给用户一个「一直带领」的事理。

关于第一次作念 AI 眼镜的讯飞来说，这亦然个绕不开的坎。

王玮跟 APPSO 聊起讯飞作念 AI 眼镜的开始，其实源于一个至极具体的画面：你念念啊，翻译机在展会、袖珍商务洽谈这些场景里是很好用的，以至公司共用一台就够。但总有一些时刻，当你在国际旅游或者某些场面，你不约略掏出建设和折腰看屏幕，不念念等翻译收尾打断言语的当然节拍。

你但愿交流是「千里浸式」的，目力经久对着互相，对话顺畅流动，翻译像空气一样感受不到存在。这副眼镜的开始，便是用户对那种「无感」体验的期待。

这种「物理中断」，是讯飞看了精深个翻译机用户的真实反馈后，攒下来的痛点。作念 AI 眼镜的公司不错整夜之间冒出来，但作念翻译的基础底细，简直没法速成。

讯飞翻译机卖了 100 万台、翻译了 10 亿次。讯飞同传跑了 42 万场国际会议，澌灭 50 多个国度，触达 4 亿不雅众，一语气 8 年管事世界两会。

这些数字千里淀下来的不仅仅算法，还有对真实场景里那些琐碎问题的感知：什么时候用户会嫌翻译慢，什么场景下手执建设让东说念主狼狈，什么杂音要求会让准确率断崖……

客岁 10 月讯飞如故推出了一款翻译耳机。耳机考据了两件事：用户如实需要开释双手的衣服式翻译；端到端的同传在衣服建设上是跑得通的，反应速率能掐在 2 秒以内。

但耳机只管耳朵，在林会杰看来，耳机的局限在于它是一个「听觉」建设（当今也运转加录像头了），眼镜则不错增多视觉的模态，多种模态重叠在一说念，跨语言调换的信息输入就丰富多了。

说白了，眼镜上有录像头不错拍照翻译，有炫耀不错投射字幕让你毋庸折腰看手机，还能放更多的麦克风作念定向降噪。

用王玮的话说便是，「眼镜离东说念主的眼睛、耳朵、嘴巴最近，它是物理世界与数字世界自然的桥梁，让翻译像呼吸一样当然发生。」

而到了 2026 年，供应链老本运转被拉下来了，国补也初次把智能眼镜纳了进来，再加上星火 X2 大模子云表翻译智力的升迁，天时地利凑皆了。

林会杰倒挺坦率：「咱们采选这个节点，是因为看到了增速才刚刚运转。」王玮更径直：咱们不念念用「iPhone 时刻」这个词，但实质上便是这个道理，眼镜立地到了奇点周边的时候。

40 克，一说念系统工程题

讯飞这款 AI 眼镜，我戴上之后第一反应是比念念象中轻。它集成了微型炫耀屏、录像头、5+1 麦克风矩阵、喇叭，但整机重量被死死卡在了 40 克。

这个数字可能许多东说念主没认识，咱们来横向对比一下：

Meta Ray-Ban 是 49 克，但它莫得炫耀屏；Rokid Glasses 亦然 49 克，带炫耀，但比讯飞重了快要 25%；华为 AI 眼镜如实轻，35.5 克，但它莫得炫耀屏。

在「带炫耀屏」的智能眼镜阵营里，讯飞目前简直作念到了行业最轻。

为什么非得是 40 克？林会杰说，这个数字是他们用模拟仿真和海量调研死磕出来的。泰西东说念主的头型和体型对重量的钝感力相比强，Meta 作念到 50 多克他们依然以为能吸收。但亚洲东说念主的颅骨结构和鼻梁高度不同，对重量相当敏锐。

关于中国用户来说，45 克是一说念分水岭，特别这个重量，戴深切就会有彰着的压迫感。40 克，是万古辰带领的「舒心阈值」。

为了抠掉这几克，团队在工程上跟供应链磨了很久。最弊端的一招，是用树脂镜片替代了传统的玻璃镜片。

传统近视眼镜早便是树脂的天地了，但为什么智能眼镜一直毋庸？因为工艺太搞心态了。智能眼镜的镜片需要作念「全贴合」，把炫耀层和镜片压在一说念。树脂材料在成型和加热时极易产生微小的气泡，胶水一朝有一点一毫的闲静，明后的折射曲率就偏了，扫数镜片就废了，良率为止比玻璃困难多。

林会杰表现，讯飞应该是行业里第一个在带炫耀的智能眼镜上把全贴合树脂工艺跑通的。研发经过中经验了至极多尝试和失败，才最终把树脂材料用在了炫耀镜片上，但讨教是苍劲的，单靠镜片这一项，就比玻璃决议轻了 30% 到 40%。

再加上定制的 0.15CC 微型光机、微型录像头模组，镜框镜腿一体成型。芯片选型和算法作念了深度耦合：相通的功能别家可能要 100mAh 电板，讯飞可能 50mAh 就够了。

是以临了咱们看到的讯飞 AI 眼镜，整机重量更轻，续航却没打折。

这是一说念系统工程题，莫得捷径，每一环都要跟供应链反复磨合良品率。树脂镜片、微型光机、低功耗芯片、算法-硬件耦合，哪一环掉链子，重量都赢得到 50 克以上。

唇动识别降噪，用眼睛帮耳朵听

翻译虽然是讯飞的舒心区，但这副眼镜上，讯飞还首发了一个有点科幻的技能——唇动识别降噪，这是多模态降噪系统的中枢部分。

这是唇动识别降噪初次搭载到 AI 眼镜上，杀青逻辑是眼镜的前置录像头会死死锁定对面言语东说念主的嘴唇。同期，眼镜上的 5 颗气导麦克风和 1 颗骨传导麦克风构成了一个六通说念的音频流。

系统及时通过「看到谁的嘴在动」，来接济判断「该听谁的声息」，从而在嘈杂的多东说念主混声中，精确地把商酌东说念主物的语音「抠」出来。

这就杀青了「看谁翻谁」的遵守，你的眼镜盯着谁，耳边响起的、镜片上跳出来的，便是谁的翻译字幕。

这个技能径直决定许多场景的翻译质料，开云世界杯官网因为翻译准不准，有一个进攻的前提听得清不清。

平定的会议室里，其实目前的翻译软硬件都不错较好责罚交流问题。但讯飞 AI 眼镜进攻的一个用户群是商务东说念主士，他们简直需要用到的翻译场景是什么？是展会、商务酒会、机场，环境杂音不端都能 80 到 90 分贝。传统翻译用具在这种环境下，准确高洁接掉进马里亚纳海沟。

高噪场景下，唇动识别降噪让识别准确率升迁了 50% 以上。林会杰解说说，这并不是单纯看口型，它交融了声源位置增强、商酌东说念主锁定等一整套多模态降噪系统，各路信号在实质使用中自动协同。

这个智力也不是拍脑袋念念出来的。讯飞在大型会议系统和汽车智能座舱里，搞这种多通说念语音分离和多模态降噪如故许多年了，在 CHiME 国际语音分离大赛上拿过 6 连冠。

王玮还给咱们共享了一个几年前的里面 Demo：几个盘问员同期讲话，东说念主耳皆备分不清，系统把每个东说念主的声息干净利落分离出来，谁说了什么都鲜明皙白。

这事儿道理的地方在于，以前开大会，你有富余的物理空间塞麦克风，有管事器的算力，有插座供电。当今，你要把这套复杂的视觉-音频交融算法，塞进一副 40 克、算力和功耗被相当压榨的眼镜里。

王玮以为，这恰正是讯飞在硬件上秀出的「肌肉」：怎样把大建设上的硬核算法作念高倍率的压缩，移植到小尺寸、轻量化的移动端侧，况且还能离线及时责罚多路语音数据。

讯飞作念硬件的旅途是「大建设考据、小建设迁徙」。在会议系统和汽车上跑通的算法压缩到眼镜端侧。唇动识别降噪需要视觉-音频配对数据、端侧及时责罚智力、多麦克风硬件的鸠合调优，单靠现成算法集成难以杀青。

降噪的准确性径直决定翻译的准确性，这亦然整条责任流的第一说念关卡。

「万能翻译」背后的基础步调

听得清之后，才是译得准的问题。

讯飞 AI 眼镜撑执 122 种语言的及时互译，差异了同声传译（听演讲）、靠近面翻译（商务洽谈）、通话翻译（跨国电话）和线上同传（接腾讯会议或 Zoom）等四种模式，录像头还能径直拍 PPT，作念外文贵寓翻译。

在现场体验中最让我以为故道理的是通话翻译。

这偶然是目前市面上惟逐一款能在你打电话时，同期帮你作念跨国翻译和纪录的眼镜。它的旅途是这么的：眼镜通过蓝牙挂载在手机上，捕捉到电话那头的英语，端到端同传模子全自动翻译，再把你的中语回复翻译成英文顶且归，蔓延在秒级。

也便是说，你在电话这头说中语，老外皮那头听到的是你的音色克隆出来的英文。电话一挂，眼镜以至能帮你把一份结构化的会议纪要发你。

畴昔，传统的翻译系统是「老三样」：语音识别（ASR）→文本翻译（MT）→语音合成（TTS）。这套决议最大的误差便是蔓延大，况且每过一个弊端，信息的「语义耗损」就多一层。

讯飞此次在眼镜上搭载端到端的语音同传大模子，跳过了中间的文本转译智商，径直杀青「语音进、语音出」，把首字反适时辰压进了 2 秒。云表撑腰的是星火 X2 模子（293B 参数的 MoE 架构，基于华为昇腾检修）。

林会杰说，他们把翻译场景切分得极其眇小，因为不同场景下需要的行业常识库和降噪模式是皆备不一样的。

讯飞这款眼镜在翻译功能上花的功夫，这有点像手机行业卷影像，拍照功能谁都有，但我有 2 亿像素，有10 倍长焦，有4K live 图，以至能澌灭专科照相场景。

翻译之后，AI 责任流才运转

到了这一步，你会发现，讯飞念念作念的如故不仅仅「翻译用具」了。这偶然亦然为什么它不叫「翻译眼镜」，而被视「目前的超等 AI 助理」。

林会杰认为，「眼镜更像是一个戴在目前的超等诡计机，带有炫耀、录像头、语音智力，它的竖立跟手机、PC 基本一样。」

承载这层智力的是讯飞的 GlassClaw，这个 Agent 能调用大模子智力、接入生态管事、作念多模态连结，把从听懂到干活的扫数经过买通，同期也撑执 OpenClaw 品级三方 Agent 接入。

你没看错，这如故一副「龙虾」眼镜。

林会杰共享了他我方使用 GlassClaw 的普通责任流：他外出毋庸时常掏手机。在路上走着，不错径直用语音叫醒 GlassClaw，让它调取手机通信录、找客户拨号，电话接通自动开翻译。

跟客户靠近面聊天时，转眼需要查阅之前的某份公约纪要，径直盲操叮咛眼镜，眼镜会去检索他的电脑贵寓，提真金不怕火出重心并同步到镜片上。

以至开完会后，眼镜自手脚念完多模态的脚色区分（谁说了什么），输出结构化纪要，他径直语音：「把纪要以邮件风物发给款式组，并把下周三的复盘会同步到日期上。」

如若你也养过虾对这些功能笃定不生疏，只不外此次交互发生在你的脸上。

当初让AI 眼镜出圈的提词器功能，在这款眼镜里也迎来升级。

讯飞 AI 眼镜的智能提词器功能作念到了语义奴隶，说到哪跟到哪，不再是机械按速率滚动，不错作念当然的智能语义连结和奴隶。配套的充电胶囊不错当遥控器，按键切换和暂停文稿。

这便是 AstronClaw 架构在底层玩的「端-边-云」三级协同：眼镜端侧追究环境感知和预责罚，边际侧作念决策，复杂的推理丢给云表的星火 X2。GlassClaw 基于讯飞自研的 Agent 智力，同期也撑执 OpenClaw 品级三方 Agent 接入。

王玮的判断是，将来的眼镜不再仅仅很简约的一副眼镜，而是你衣服最约略的一个随身助理。

市集上单作念翻译或单作念 AI 助手的家具不少，但把「翻译 + 纪录 + 纪要 + 跨端扩充」串成顺滑的责任流，需要语音、翻译、大模子、智能体（Agent）四种底层智力同期在线，且丝丝入扣。

讯飞这种全栈的技能智力，适值在眼镜这个载体上找到了合适的闭环。

AI 眼镜的下半场，拼的是什么

畴昔两年，AI 波澜裹带着扫数硬件行业寻找阿谁所谓的「Next Gen」进口。

AI Pin 翻车了，各式智能吊坠无疾而终，虽然 AI 硬件的家具形态和技能阶梯差异，但行业也慢慢酿成一些共鸣： AI 需要眼睛，它必须能及时感知东说念主类所处的三维物理世界。

AI 眼镜未必不是最终形态，但它是目前惟一能够全天候、第一视角承载视觉与听觉输入的形态。

王玮在采访里提到一个挺故道理的预判：「将来的数字生存三件套，偶然率是电脑、手机和眼镜。眼镜不是手机的配件，它我约略是一台架在鼻梁上的独处主机。」

眼镜自然相宜作念联结物理世界和数字世界的建设。况且硬件自己还有很长的迭代空间：炫耀会从单色走向全彩、从 2K 走向 4K；录像头和麦克风还会向 AI 原生的 token 编码风物升级。王玮说这些技能旅途如故运转有相比了了的发展场地了。

林会杰表现，讯飞的第二代 AI 眼镜如故在诡计中，最快 2026 年秋季能看到，面向更多不同东说念主群，也在摸索一些细分的垂直场景。

畴昔一年 APPSO 测过、写过不少 AI 眼镜。回头看百镜大战，行业其实如故分化出了两条不同的路：

一条是「作念最佳的眼镜，让 AI 成为加分项」。 Meta Ray-Ban 是这个逻辑：用前卫想象和品牌文化来对冲用户对 AI 智力的低频刚需。

另一条是「作念更深的 AI 责任流，让眼镜成为新的电脑」。讯飞采选的便是这条路。两条路指向不同的竞争维度，但后一条更难走，因为它要求你同期具备硬件工程智力和 AI 全栈智力，统筹兼顾。

AI 眼镜的下半场，简直的分水岭在于，谁能把 AI 揉进高度细分的真实场景里，替用户把一件件琐碎任务给办了。

让眼镜总结眼镜， AI 老敦结识当「牛马」。

临了能留住来的建设，我念念偶然是这么的：当你摘下它的时候，会转眼以为目前的世界变得千里重而低效。