红海之上的新蓝海:没人注意到,聆思已经拿下了半个消费级 AI 视觉 | 前沿在线

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_1.pngoutput_1

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_2.pngoutput_2

编辑:前沿在线 编辑部

2026 年的视觉产业,正在上演最撕裂的一幕。

一边是传统市场的尸横遍野:

影像赛道,手机摄像头卷到 2 亿像素也卖不动,相机厂商在全画幅的参数竞赛里互相残杀;安防赛道,海康大华双寡头垄断了全球 70% 的市场,中小厂商只能靠价格战苟活。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_3.pngoutput_3

这个年规模数百亿美元的成熟市场,早就被瓜分完毕,连一丝缝隙都没给新玩家留下。

所有人都在说:视觉市场太卷了,没机会了。

但很少有人注意到,在这片红海之上,一个全新的万亿级增量市场正在以 30% 的年增速疯狂爆发

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_4.pngoutput_4

它不拼像素,不拼画质,甚至不要求看得有多清。

它拼的是图像和场景结合之后,能创造什么样的应用价值;而这些价值,正在悄无声息地渗透进你生活的每一个角落,把很多曾经只存在于科幻片里的功能,变成了所有人习以为常的日常。

在内容创作赛道,自动跟拍早就不是专业摄影师的专属技能。

从几十块钱的桌面云台到几千块的手持稳定器,

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_5.pngoutput_5

再到能翻山越岭的消费级无人机,识别人脸自动跟拍、智能构图已经成了行业标配。

现在哪怕是一个刚入门的新手博主,不用麻烦别人举相机,不用手动调角度,一个人就能拍出丝滑流畅的 vlog 和直播画面。

在教育场景,离线 OCR 识别让扫描笔成了中小学生的必备文具。

不用联网,不用等云端加载,扫一下单词就能出发音、释义和例句,甚至连整段文字的翻译都能一秒完成。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_6.pngoutput_6

除此之外,能识别坐姿的学习桌、能批改作业的智能台灯,也都靠着视觉能力,重新定义了教育硬件的形态。

在智能家居里,视觉正在成为语音之外更自然的交互方式。

门锁不用掏钥匙,扫脸就能开门;

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_7.pngoutput_7

风扇不用手动摇头,能精准识别人体位置跟着吹;

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_8.pngoutput_8

电视不用找遥控器,一个手势就能快进暂停;甚至连空调都能根据房间里的人数和位置,自动调节风向和温度。

就连曾经最传统的玩具赛道,视觉也成了不可或缺的核心能力。

能跟着孩子跑的 AI 陪伴机器人、

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_9.pngoutput_9

能识别手势的互动积木、能自动追踪足球的玩具车……

这些曾经只能靠遥控器操作的玩具,现在都能 “看见” 世界,和孩子产生真正的互动。

这就是消费级 AI 视觉

它不是传统视觉的升级,而是一场彻头彻尾的革命。

它把视觉从一个 “记录工具”,变成了一个 “交互入口”,重新定义了几乎所有智能硬件的形态。

而在这个所有人都没看懂的新市场里,唱主角的不是高通,不是英伟达,不是海康大华,而是一家你可能连名字都没听过的公司 —— 聆思科技

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_10.pngoutput_10

提到聆思,99% 的人的第一反应都是:“哦,那个做语音芯片的。”

这没错。

你家里的美的、海尔、海信空调,喊一声就能开关调温的那种,十台有九台用的都是它的 CSK 系列芯片。在家电语音这个赛道,聆思早就做到了绝对统治,截至 2026 年 3 月,五大系列 AI 芯片累计出货已突破 1.5 亿颗。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_11.jpgoutput_11

这家成立于 2020 年的公司,是安徽省及合肥市国资平台在端侧 AI 领域的重点投资布局企业,还有元禾璞华、沄柏、天际、盈科、讯飞创投等一线资本加持。

但几乎没人知道,这家靠语音起家的公司,已经悄悄把战火烧到了 AI 视觉。

过去三年,它累计卖出了超过 3000 万套视觉方案,覆盖了从云台、扫描笔到智能门锁、会议摄像头的几乎所有消费级视觉场景。

在桌面跟拍云台这个品类,它的市占率已超过 80%;在扫描笔市场,它的方案更是成了行业事实标准。

当整个 AI 芯片行业都在卷大算力、卷先进制程、喊着 “干翻英伟达” 的时候,聆思走了一条完全相反的路:不做 Linux,不堆 TOPS,不炒概念,用一套全球首个大规模商用的 RTOS 软硬协同方案,硬生生在巨头环伺的市场里,撕开了一道万亿级的口子。

今天我们就聊聊这个藏在你生活里的隐形冠军,以及它戳破的整个 AI 芯片行业最大的谎言。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_12.pngoutput_12

今年很多 AI 硬件老板,都在骂 Linux 芯片

2026 年开年,我认识的所有做 AI 硬件的创始人,没有一个不骂 Linux 芯片的。

不是情绪发泄,是真的活不下去了。

2026 年开年以来,所有主流 Linux AI 芯片全线涨价,核心原因是全球 AI 需求爆发导致内存产能严重不足。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_13.pngoutput_13

TrendForce 数据显示,2026 年第一季度常规 DRAM 合同价格环比上涨 93-98%,NAND 合约价也涨了85%~90%,预期2026 年第二季DRAM 合约价将上涨58%~63%、NAND 合约价涨幅更预估高达70%~75%。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_14.jpgoutput_14

DDR5 内存条价格在半年内也暴涨约 300%,连曾经以性价比著称的 Raspberry Pi 5 价格也上涨了 150%。

对于依赖外挂大容量内存的 Linux AI 芯片来说,这意味着 BOM 成本直接上涨 2-3 倍。

过去五年,整个行业默认了一个不容置疑的 “标准答案”:做 AI 视觉,必须用 Linux 芯片。

理由听起来天经地义:Linux 生态完善,GitHub 上随便搜就能找到开源算法,开发者拿来就能用,根本不用考虑内存限制、资源分配这些破事。只要堆够 0.5T 以上的算力,什么人形追踪、OCR 识别、手势控制,通通都能跑。

但这个 “标准答案”,从一开始就是裹着糖衣的毒药。

为了跑 Linux 系统和臃肿的开源算法,芯片必须外挂大容量 DDR 内存和 eMMC 存储,外围电路复杂得像蜘蛛网。

算下来,单是芯片 + BOM 成本就要几百块,最后反映到终端产品上,就是售价居高不下:

  • 三年前,带 AI 跟拍的云台普遍卖 3000 块以上
  • 一支能离线翻译的扫描笔,要价 1000 元起步
  • 稍微带点人脸识别的门锁,没有 500 块拿不下来

更离谱的是算力浪费。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_15.pngoutput_15

为了覆盖所有可能的场景,Linux 芯片设计了大量通用模块。

但在具体的视觉任务里,80% 的算力都是空转的。标称 1T 的芯片,真正能用在人形追踪上的,可能连 0.2T 都不到。剩下的算力,除了费电和涨价,没有任何用处。

“就像你买了一辆 12 缸的劳斯莱斯,天天在小区里买菜开,油耗高得吓人,速度还不如电动车。”

深圳一家硬件厂商的 CTO 跟我吐槽,”但没办法,行业里只有这个方案能用。”

今年的涨价,成了压垮骆驼的最后一根稻草。

很多中小厂商算了一笔账:原来 BOM 成本 50 块的产品,现在涨到 150 块,终端售价要翻一倍才能保本,根本卖不动。不少已经立项半年的项目直接砍了,还有的厂商干脆清库存转行。

那有没有更便宜的替代方案?

有,RTOS。

RTOS 是一种轻量级实时操作系统,体积只有几百 KB,不用外挂内存,BOM 成本只有 Linux 方案的 1/3,功耗也只有后者的一半。理论上,它才是消费级 AI 视觉的最佳选择。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_16.pngoutput_16

但很长一段时间里,整个行业都没能拿出一个能用的 RTOS 视觉方案。

不是没人试过,是做出来的都是垃圾:电机转起来一顿一顿的,手势比半天没反应,人稍微走快点就跟丢,稍微挡一下就直接原地罢工。

问题出在哪?

RTOS 的内存只有 Linux 的零头,开源算法直接扔进去,根本跑不起来。必须把算法拆到原子级,一点点裁剪、优化、重写,才能在有限的资源里流畅运行。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_17.pngoutput_17

这是一个极其苦、极其累、极其考验技术功底的活,而且没有任何捷径可走。

但整个产业链,没有任何人愿意干这个活:

  • 芯片大厂不会干:他们只卖芯片,养几百个算法团队不划算
  • 算法公司不会干:他们不懂芯片底层,再怎么优化也达不到要求
  • 终端厂商更不会干:他们连自己的算法团队都没有,全靠第三方外包

更坑的是第三方算法公司。

他们给 A 厂商做的算法,放到 B 厂商的芯片上就跑不动;换个摄像头型号,又要重新适配。最后钱没少花,时间没少耗,做出来的产品还是一堆问题。

整个行业就卡在这里了:贵的用不起,便宜的不好用。

所有人都在等一个破局者。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_18.pngoutput_18

没人想到,最后破局的是一家做语音的公司

2023 年,当整个行业还在 Linux 的泥潭里挣扎的时候,聆思悄悄扔出了第一代 RTOS 视觉方案。

整个行业都炸了。

没人想到,最后把这事干成的,居然是一家做语音芯片的公司。

但只要你懂端侧 AI 的底层逻辑,就会发现这根本不是意外,而是必然。

做端侧 AI 的本质,从来都不是堆算力,而是螺蛳壳里做道场:在指甲盖大的芯片里,在几块钱的成本里,把每一分算力、每一个字节的内存都榨干。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_19.pngoutput_19

过去六年,聆思在语音芯片上干的就是这件事。

它把语音识别、降噪、TTS 合成全链路塞进了一颗几块钱的芯片里,不用联网,不用外挂内存,就能实现流畅的语音交互。正是这套 “极致资源优化” 的功夫,让它在家电语音市场杀到了第一。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_20.jpgoutput_20

而这套功夫,放到视觉上,简直是降维打击。

和其他厂商 “先造芯片再找算法凑” 的思路完全不同,聆思走了一条反常识的路:算法定义芯片

别人是先画好 CPU、NPU 的框图,再让算法团队去适配硬件;聆思是先把视觉算法拆解到最细的算子粒度,精准算清楚每一个算子需要多少算力、多少内存、多少带宽,再照着这些需求去设计芯片架构。

做人形追踪,它就把 NPU 里负责特征提取、目标检测、轨迹预测的算子做到极致,把没用的通用浮点运算单元全砍掉;做 OCR 识别,它就专门集成了一个图像预处理加速器,让文字识别速度直接翻 3 倍;做电机控制,它就专门优化指令集,让电机转得像丝一样顺滑,不会出现一顿一顿的情况。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_21.pngoutput_21

正是这种从算子层面就和算法深度绑定的设计,让聆思的芯片对图像检测追踪、图文 OCR 这类端侧视觉任务天生就特别友好。

更关键的是,聆思有自己的全职算法团队,能一边根据芯片特性打磨算法,一边根据实际场景的需求反过来调整芯片设计,真正做到了软硬件的双向协同。

这种软硬深度绑定的模式,带来了两个革命性的结果:

第一,算力利用率干到了 80% 以上

同样跑 30 帧的人形追踪,Linux 芯片需要 0.5T 算力,聆思只用 0.1T 就够了。这意味着成本直接降到原来的 1/3,功耗降到原来的 1/4;

第二,算法效果碾压所有同行

针对 RTOS 的内存限制,聆思的算法团队把模型压缩到了原来的 1/10,精度损失不到 1%。别人做不出来的 RTOS 视觉,它不仅做出来了,效果还比 Linux 方案更好。

有个云台厂商给我算了一笔账,我至今印象深刻:

” 用 Linux 方案,BOM 成本 120 块,开发周期 6 个月,招 3 个算法工程师改了半年,最后跟随还是会抖;用聆思的 RTOS 方案,BOM 成本 45 块,开发周期 1 个月,他们把算法都调好了,我们只要套个壳就能卖。这根本不是竞争,是降维打击。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_22.pngoutput_22

一夜之间,整个行业都切换到了聆思的方案。

几十块钱的 AI 云台铺满了淘宝京东,几百块的扫描笔成了学生党标配,AI 跟随风扇成了今年夏天的爆款。

曾经高高在上的 AI 视觉,就这样变成了普通人都能消费得起的日常功能。

但聆思没有停下脚步。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_23.pngoutput_23

从单模态到多模态,它已经准备好了下一张牌

就在上个月(2026 年 5 月 10 日),聆思又扔出了一颗重磅炸弹:第三代多模态 AI SoC 芯片 VenusA() 正式发布。

别看它还是指甲盖大小的一块,里面塞了双核 RISC-V CPU 和专门为多模态设计的 NPU,主频拉到了 400MHz,NPU 峰值算力 256 GOPS,实打实的多模态 AI 性能直接比上一代翻了 3 倍。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_24.pngoutput_24

最狠的还是它的视觉跟随能力,直接来了个质的飞跃:

以前最多跟 7 米,现在直接干到 15 米,覆盖了从室内直播到户外露营的所有场景;手势识别距离拉到 5.5 米,比个 OK 一秒就能响应;不管是单人还是多人同框,全程稳定 30 帧不掉,就算你突然跑起来、或者周围人来人往,镜头也不会跟丢、不会卡顿。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_25.pngoutput_25

而这,还只是聆思多模态布局的冰山一角。

其实早在今年 3 月的 AWE() 家电展上,聆思就已经亮出了自己的下一张牌:专门给大模型家电做的 ARCS 系列芯片,还有 HomeClaw 全屋智能算力中心方案。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_26.jpgoutput_26

和市面上东拼西凑的方案不一样,ARCS 把 AI 算力、主控、多媒体、无线连接全塞进了一颗芯片里,一颗就能搞定 “语音听懂→视觉看懂→调用云端大模型” 的完整流程

现在你能买到的很多智能浴霸、AI 陪伴机器人、智能闹钟、词典笔,里面用的都是这套已经跑通的成熟方案。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_27.pngoutput_27

最近我拆解了好几款今年的爆款硬件,发现了一个很有意思的趋势:越来越多看起来和视觉无关的产品,开始偷偷装上聆思的芯片。

比如和 EMEET 壹秘合作的 PIXY 4K 超清双目 AI 智能云台摄像头,绝对是今年办公硬件赛道杀出来的最大黑马。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_28.pngoutput_28

它不仅能输出 4K、30fps 的超高清视频通话,搭载了通过 Zoom 认证的 AI 降噪算法,能完美过滤键盘敲击、开门关门这些办公室常见噪音;

更厉害的是它的 AI 自动跟拍功能 —— 不管你在会议室里走来走去讲 PPT,还是站在白板前写板书,镜头都会稳稳锁定你,永远把你放在画面 C 位。远程会议再也不用几个人挤在一个镜头前,也不用手忙脚乱地调角度了。

这款产品能卖爆的核心,就是它同时集成了聆思的语音和视觉双能力。

一颗 CSK6 芯片,同时搞定 AI 降噪和智能跟拍,不用再像以前那样分别用两颗芯片来处理音视频,不仅 BOM 成本直接砍了一半,还解决了多芯片之间的协同延迟问题,让整个设备的响应速度和稳定性都上了一个台阶。

再比如如今热度居高不下的 AI 陪伴机器人与互动玩具,正是多模态融合的典型代表。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_30.jpgoutput_30

它们既能流畅响应各类语音指令、依托大模型实现自然对话,还能依靠视觉能力精准跟随移动、识别动作表情。不管是日常聊天互动、趣味问答,还是感知情绪、陪伴玩乐,一台设备就能兼顾多重体验。

原本只是简单发声、被动执行指令的玩具与机器人,如今蜕变成了能看、能听、能互动的智能伙伴。这就是多模态融合带来的全新产品体验。

这些案例正在证明一个道理:AI 硬件的下一个增量,不是单一功能的升级,而是多模态能力的融合。

过去的智能硬件,要么只能听,要么只能看,交互方式非常单一。

未来的智能硬件会同时具备语音、视觉、触觉等多种感知能力,能够更自然、更智能地和用户交互它不再是一个被动执行指令的工具,而是一个主动理解用户需求的助手。

而聆思,是目前全行业唯一一个,能同时提供成熟语音和视觉方案的芯片公司。

别人需要两颗芯片、两个算法团队、半年开发周期才能实现的功能,它用一颗芯片、一套方案、一个月就能搞定。这就是无可比拟的竞争优势。

现在,已经有越来越多的厂商开始和聆思合作,探索多模态的可能性:

  • 早教机器人,既能听懂孩子的问题,又能看懂孩子的绘本和表情
  • 智能台灯,既能语音控制,又能识别孩子的坐姿,提醒矫正
  • 智能厨房,既能语音导航菜谱,又能识别食材,自动调节火候

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_31.jpgoutput_31

AI 正在为传统硬件创造无限的创新空间。

而聆思,正在成为这个新时代的底层基础设施。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_32.pngoutput_32

所有人都在卷大模型,它走在了最前面

当整个行业都在为手机端侧大模型疯狂的时候,聆思又一次走在了前面。

聆思早已开启面向智能终端的端侧大模型专用芯片研发,将在今年年底推出。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_33.jpgoutput_33

现在所有人都在喊 “端侧大模型”,但 99% 的人都搞错了方向。

他们以为端侧大模型就是在手机上跑 ChatGPT,就是堆 10T、20T 的算力。

但实际上,端侧大模型最大的市场,根本不在手机上,而是在具身智能机器人、全屋智能家居、汽车座舱等为代表的海量终端

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_34.jpgoutput_34

AI 眼镜需要实时理解你看到的场景,给你提供即时的信息辅助;服务机器人需要理解家庭环境,识别物体和人物,自主完成家务任务。

但它们对芯片的要求也最苛刻:体积要小,功耗要低,成本要便宜,还要能同时处理语音和视觉数据。

而市面上绝大多数现有端侧 AI 芯片,根本满足不了这些要求。

这些芯片大多还是围绕传统 CNN 等轻量模型设计的,计算、存储和数据流架构完全没有针对 Transformer 特有的注意力机制、长序列依赖做原生优化。

有行业数据显示,用传统 CNN 加速器跑大模型推理,算力利用率甚至不到 1%—— 这也是为什么很多标称几十 TOPS 的芯片,实际跑大模型却卡得像幻灯片。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_35.pngoutput_35

更要命的是,大模型推理的真正瓶颈从来都不是标称的 TOPS 算力,而是内存带宽、缓存效率和数据重用能力 —— 这恰恰是传统端侧芯片的最大短板

再加上终端设备在功耗、成本、芯片面积和散热上的极限约束,云端那套堆算力的架构根本不可能在端侧复制。想要让大模型真正走进亿万普通设备,必须在有限的物理边界内,重新构建一套兼顾能效比和成本的全新设计范式

而这,恰恰是聆思最擅长的事。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_36.pngoutput_36

和其他公司 “先造大算力芯片再找活干” 的思路不同,聆思还是老路子:先搞清楚机器人和眼镜到底需要什么,再去设计芯片。

它没有盲目堆 TOPS,而是重点解决大模型推理最头疼的三个问题:内存带宽、能效比和多模态融合。采用面向大模型的原生架构,配合自研的模型压缩和推理引擎,目标是用低成本、高性价比的方案来实现流畅的 7B 大模型推理能力。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_37.pngoutput_37

如果这个目标能实现,将彻底改变整个行业的格局。

它将让大模型从手机、电脑这些高端设备,下沉到所有的智能终端中。到那时,我们身边的每一个设备,都将具备理解和思考的能力。

真正的智能时代,才会到来。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_38.pngoutput_38

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_39.pngoutput_39

中国芯片不需要第二个英伟达

很长一段时间里,我们都陷入了一种病态的执念:好像中国芯片只有做出自己的英伟达,只有追上 7nm、5nm 的先进制程,才算成功。

所有人都在追大算力、追高端市场、喊着 “干翻国际巨头”。

但聆思的故事告诉我们,中国芯片还有另一条路。

一条不需要最先进的光刻机,不需要和巨头正面硬刚的路。一条深耕场景、软硬协同、把用户真正需要的东西做到极致的路。

全球 AI 芯片市场,其实是一个三层金字塔:

  • 塔尖是云端大算力,被英伟达垄断,后来者几乎没有机会;
  • 中层是高端端侧,被高通、苹果把持,竞争异常激烈;
  • 塔基是海量的消费电子、家电、教育硬件,市场规模是上层的好几倍,但长期被忽略。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_40.jpgoutput_40

而中国公司,最擅长的就是打塔基市场。

我们有全球最大的制造业基地,有最完整的产业链,有最庞大的消费市场。我们最懂普通消费者需要什么,我们能最快地响应市场的变化。

聆思没有去抢云端的蛋糕,而是扎根在别人看不起的端侧小算力市场,用六年时间,把 1.5 亿颗芯片装进了全世界的智能设备里。它没有喊过一句 “干翻英伟达”,但它实实在在地改变了我们的生活。

很多人到现在还以为,聆思只是一家做语音芯片的公司。

但他们不知道,这家公司已经悄悄完成了从语音到视觉,再到多模态大模型的技术跨越。它正在从一个单一的芯片供应商,变成一个端侧 AI 的平台级公司

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_41.pngoutput_41

中国不需要第二个英伟达。

中国需要 100 个聆思这样的公司。

它们不追风口,不炒概念,不讲故事,只是默默地把技术做到极致,把成本降到最低,把体验做到最好

当所有人都在盯着云端的万亿大模型市场的时候,端侧的万亿市场已经被悄悄瓜分完了。

而那些闷声干大事的公司,终将走到舞台中央。

Frontiers
Frontiers
文章: 338