红海之上的新蓝海：没人注意到，聆思已经拿下了半个消费级 AI 视觉

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_1.pngoutput_1

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_2.pngoutput_2

编辑：前沿在线编辑部

2026 年的视觉产业，正在上演最撕裂的一幕。

一边是传统市场的尸横遍野：

影像赛道，手机摄像头卷到 2 亿像素也卖不动，相机厂商在全画幅的参数竞赛里互相残杀；安防赛道，海康大华双寡头垄断了全球 70% 的市场，中小厂商只能靠价格战苟活。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_3.pngoutput_3

这个年规模数百亿美元的成熟市场，早就被瓜分完毕，连一丝缝隙都没给新玩家留下。

所有人都在说：视觉市场太卷了，没机会了。

但很少有人注意到，在这片红海之上，一个全新的万亿级增量市场正在以 30% 的年增速疯狂爆发。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_4.pngoutput_4

它不拼像素，不拼画质，甚至不要求看得有多清。

它拼的是图像和场景结合之后，能创造什么样的应用价值；而这些价值，正在悄无声息地渗透进你生活的每一个角落，把很多曾经只存在于科幻片里的功能，变成了所有人习以为常的日常。

在内容创作赛道，自动跟拍早就不是专业摄影师的专属技能。

从几十块钱的桌面云台到几千块的手持稳定器，

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_5.pngoutput_5

再到能翻山越岭的消费级无人机，识别人脸自动跟拍、智能构图已经成了行业标配。

现在哪怕是一个刚入门的新手博主，不用麻烦别人举相机，不用手动调角度，一个人就能拍出丝滑流畅的 vlog 和直播画面。

在教育场景，离线 OCR 识别让扫描笔成了中小学生的必备文具。

不用联网，不用等云端加载，扫一下单词就能出发音、释义和例句，甚至连整段文字的翻译都能一秒完成。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_6.pngoutput_6

除此之外，能识别坐姿的学习桌、能批改作业的智能台灯，也都靠着视觉能力，重新定义了教育硬件的形态。

在智能家居里，视觉正在成为语音之外更自然的交互方式。

门锁不用掏钥匙，扫脸就能开门；

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_7.pngoutput_7

风扇不用手动摇头，能精准识别人体位置跟着吹；

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_8.pngoutput_8

电视不用找遥控器，一个手势就能快进暂停；甚至连空调都能根据房间里的人数和位置，自动调节风向和温度。

就连曾经最传统的玩具赛道，视觉也成了不可或缺的核心能力。

能跟着孩子跑的 AI 陪伴机器人、

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_9.pngoutput_9

能识别手势的互动积木、能自动追踪足球的玩具车……

这些曾经只能靠遥控器操作的玩具，现在都能 “看见” 世界，和孩子产生真正的互动。

这就是消费级 AI 视觉。

它不是传统视觉的升级，而是一场彻头彻尾的革命。

它把视觉从一个 “记录工具”，变成了一个 “交互入口”，重新定义了几乎所有智能硬件的形态。

而在这个所有人都没看懂的新市场里，唱主角的不是高通，不是英伟达，不是海康大华，而是一家你可能连名字都没听过的公司 —— 聆思科技。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_10.pngoutput_10

提到聆思，99% 的人的第一反应都是：“哦，那个做语音芯片的。”

这没错。

你家里的美的、海尔、海信空调，喊一声就能开关调温的那种，十台有九台用的都是它的 CSK 系列芯片。在家电语音这个赛道，聆思早就做到了绝对统治，截至 2026 年 3 月，五大系列 AI 芯片累计出货已突破 1.5 亿颗。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_11.jpgoutput_11

这家成立于 2020 年的公司，是安徽省及合肥市国资平台在端侧 AI 领域的重点投资布局企业，还有元禾璞华、沄柏、天际、盈科、讯飞创投等一线资本加持。

但几乎没人知道，这家靠语音起家的公司，已经悄悄把战火烧到了 AI 视觉。

过去三年，它累计卖出了超过 3000 万套视觉方案，覆盖了从云台、扫描笔到智能门锁、会议摄像头的几乎所有消费级视觉场景。

在桌面跟拍云台这个品类，它的市占率已超过 80%；在扫描笔市场，它的方案更是成了行业事实标准。

当整个 AI 芯片行业都在卷大算力、卷先进制程、喊着 “干翻英伟达” 的时候，聆思走了一条完全相反的路：不做 Linux，不堆 TOPS，不炒概念，用一套全球首个大规模商用的 RTOS 软硬协同方案，硬生生在巨头环伺的市场里，撕开了一道万亿级的口子。

今天我们就聊聊这个藏在你生活里的隐形冠军，以及它戳破的整个 AI 芯片行业最大的谎言。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_12.pngoutput_12

今年很多 AI 硬件老板，都在骂 Linux 芯片

2026 年开年，我认识的所有做 AI 硬件的创始人，没有一个不骂 Linux 芯片的。

不是情绪发泄，是真的活不下去了。

2026 年开年以来，所有主流 Linux AI 芯片全线涨价，核心原因是全球 AI 需求爆发导致内存产能严重不足。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_13.pngoutput_13

TrendForce 数据显示，2026 年第一季度常规 DRAM 合同价格环比上涨 93-98%，NAND 合约价也涨了85%~90%，预期2026 年第二季DRAM 合约价将上涨58%~63%、NAND 合约价涨幅更预估高达70%~75%。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_14.jpgoutput_14

DDR5 内存条价格在半年内也暴涨约 300%，连曾经以性价比著称的 Raspberry Pi 5 价格也上涨了 150%。

对于依赖外挂大容量内存的 Linux AI 芯片来说，这意味着 BOM 成本直接上涨 2-3 倍。

过去五年，整个行业默认了一个不容置疑的 “标准答案”：做 AI 视觉，必须用 Linux 芯片。

理由听起来天经地义：Linux 生态完善，GitHub 上随便搜就能找到开源算法，开发者拿来就能用，根本不用考虑内存限制、资源分配这些破事。只要堆够 0.5T 以上的算力，什么人形追踪、OCR 识别、手势控制，通通都能跑。

但这个 “标准答案”，从一开始就是裹着糖衣的毒药。

为了跑 Linux 系统和臃肿的开源算法，芯片必须外挂大容量 DDR 内存和 eMMC 存储，外围电路复杂得像蜘蛛网。

算下来，单是芯片 + BOM 成本就要几百块，最后反映到终端产品上，就是售价居高不下：

三年前，带 AI 跟拍的云台普遍卖 3000 块以上
一支能离线翻译的扫描笔，要价 1000 元起步
稍微带点人脸识别的门锁，没有 500 块拿不下来

更离谱的是算力浪费。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_15.pngoutput_15

为了覆盖所有可能的场景，Linux 芯片设计了大量通用模块。

但在具体的视觉任务里，80% 的算力都是空转的。标称 1T 的芯片，真正能用在人形追踪上的，可能连 0.2T 都不到。剩下的算力，除了费电和涨价，没有任何用处。

“就像你买了一辆 12 缸的劳斯莱斯，天天在小区里买菜开，油耗高得吓人，速度还不如电动车。”

深圳一家硬件厂商的 CTO 跟我吐槽，”但没办法，行业里只有这个方案能用。”

今年的涨价，成了压垮骆驼的最后一根稻草。

很多中小厂商算了一笔账：原来 BOM 成本 50 块的产品，现在涨到 150 块，终端售价要翻一倍才能保本，根本卖不动。不少已经立项半年的项目直接砍了，还有的厂商干脆清库存转行。

那有没有更便宜的替代方案？

有，RTOS。

RTOS 是一种轻量级实时操作系统，体积只有几百 KB，不用外挂内存，BOM 成本只有 Linux 方案的 1/3，功耗也只有后者的一半。理论上，它才是消费级 AI 视觉的最佳选择。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_16.pngoutput_16

但很长一段时间里，整个行业都没能拿出一个能用的 RTOS 视觉方案。

不是没人试过，是做出来的都是垃圾：电机转起来一顿一顿的，手势比半天没反应，人稍微走快点就跟丢，稍微挡一下就直接原地罢工。

问题出在哪？

RTOS 的内存只有 Linux 的零头，开源算法直接扔进去，根本跑不起来。必须把算法拆到原子级，一点点裁剪、优化、重写，才能在有限的资源里流畅运行。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_17.pngoutput_17

这是一个极其苦、极其累、极其考验技术功底的活，而且没有任何捷径可走。

但整个产业链，没有任何人愿意干这个活：

芯片大厂不会干：他们只卖芯片，养几百个算法团队不划算
算法公司不会干：他们不懂芯片底层，再怎么优化也达不到要求
终端厂商更不会干：他们连自己的算法团队都没有，全靠第三方外包

更坑的是第三方算法公司。

他们给 A 厂商做的算法，放到 B 厂商的芯片上就跑不动；换个摄像头型号，又要重新适配。最后钱没少花，时间没少耗，做出来的产品还是一堆问题。

整个行业就卡在这里了：贵的用不起，便宜的不好用。

所有人都在等一个破局者。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_18.pngoutput_18

没人想到，最后破局的是一家做语音的公司

2023 年，当整个行业还在 Linux 的泥潭里挣扎的时候，聆思悄悄扔出了第一代 RTOS 视觉方案。

整个行业都炸了。

没人想到，最后把这事干成的，居然是一家做语音芯片的公司。

但只要你懂端侧 AI 的底层逻辑，就会发现这根本不是意外，而是必然。

做端侧 AI 的本质，从来都不是堆算力，而是螺蛳壳里做道场：在指甲盖大的芯片里，在几块钱的成本里，把每一分算力、每一个字节的内存都榨干。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_19.pngoutput_19

过去六年，聆思在语音芯片上干的就是这件事。

它把语音识别、降噪、TTS 合成全链路塞进了一颗几块钱的芯片里，不用联网，不用外挂内存，就能实现流畅的语音交互。正是这套 “极致资源优化” 的功夫，让它在家电语音市场杀到了第一。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_20.jpgoutput_20

而这套功夫，放到视觉上，简直是降维打击。

和其他厂商 “先造芯片再找算法凑” 的思路完全不同，聆思走了一条反常识的路：算法定义芯片。

别人是先画好 CPU、NPU 的框图，再让算法团队去适配硬件；聆思是先把视觉算法拆解到最细的算子粒度，精准算清楚每一个算子需要多少算力、多少内存、多少带宽，再照着这些需求去设计芯片架构。

做人形追踪，它就把 NPU 里负责特征提取、目标检测、轨迹预测的算子做到极致，把没用的通用浮点运算单元全砍掉；做 OCR 识别，它就专门集成了一个图像预处理加速器，让文字识别速度直接翻 3 倍；做电机控制，它就专门优化指令集，让电机转得像丝一样顺滑，不会出现一顿一顿的情况。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_21.pngoutput_21

正是这种从算子层面就和算法深度绑定的设计，让聆思的芯片对图像检测追踪、图文 OCR 这类端侧视觉任务天生就特别友好。

更关键的是，聆思有自己的全职算法团队，能一边根据芯片特性打磨算法，一边根据实际场景的需求反过来调整芯片设计，真正做到了软硬件的双向协同。

这种软硬深度绑定的模式，带来了两个革命性的结果：

第一，算力利用率干到了 80% 以上。

同样跑 30 帧的人形追踪，Linux 芯片需要 0.5T 算力，聆思只用 0.1T 就够了。这意味着成本直接降到原来的 1/3，功耗降到原来的 1/4；

第二，算法效果碾压所有同行。

针对 RTOS 的内存限制，聆思的算法团队把模型压缩到了原来的 1/10，精度损失不到 1%。别人做不出来的 RTOS 视觉，它不仅做出来了，效果还比 Linux 方案更好。

有个云台厂商给我算了一笔账，我至今印象深刻：

” 用 Linux 方案，BOM 成本 120 块，开发周期 6 个月，招 3 个算法工程师改了半年，最后跟随还是会抖；用聆思的 RTOS 方案，BOM 成本 45 块，开发周期 1 个月，他们把算法都调好了，我们只要套个壳就能卖。这根本不是竞争，是降维打击。”

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_22.pngoutput_22

一夜之间，整个行业都切换到了聆思的方案。

几十块钱的 AI 云台铺满了淘宝京东，几百块的扫描笔成了学生党标配，AI 跟随风扇成了今年夏天的爆款。

曾经高高在上的 AI 视觉，就这样变成了普通人都能消费得起的日常功能。

但聆思没有停下脚步。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_23.pngoutput_23

从单模态到多模态，它已经准备好了下一张牌

就在上个月（2026 年 5 月 10 日），聆思又扔出了一颗重磅炸弹：第三代多模态 AI SoC 芯片 VenusA() 正式发布。

别看它还是指甲盖大小的一块，里面塞了双核 RISC-V CPU 和专门为多模态设计的 NPU，主频拉到了 400MHz，NPU 峰值算力 256 GOPS，实打实的多模态 AI 性能直接比上一代翻了 3 倍。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_24.pngoutput_24

最狠的还是它的视觉跟随能力，直接来了个质的飞跃：

以前最多跟 7 米，现在直接干到 15 米，覆盖了从室内直播到户外露营的所有场景；手势识别距离拉到 5.5 米，比个 OK 一秒就能响应；不管是单人还是多人同框，全程稳定 30 帧不掉，就算你突然跑起来、或者周围人来人往，镜头也不会跟丢、不会卡顿。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_25.pngoutput_25

而这，还只是聆思多模态布局的冰山一角。

其实早在今年 3 月的 AWE() 家电展上，聆思就已经亮出了自己的下一张牌：专门给大模型家电做的 ARCS 系列芯片，还有 HomeClaw 全屋智能算力中心方案。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_26.jpgoutput_26

和市面上东拼西凑的方案不一样，ARCS 把 AI 算力、主控、多媒体、无线连接全塞进了一颗芯片里，一颗就能搞定 “语音听懂→视觉看懂→调用云端大模型” 的完整流程。

现在你能买到的很多智能浴霸、AI 陪伴机器人、智能闹钟、词典笔，里面用的都是这套已经跑通的成熟方案。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_27.pngoutput_27

最近我拆解了好几款今年的爆款硬件，发现了一个很有意思的趋势：越来越多看起来和视觉无关的产品，开始偷偷装上聆思的芯片。

比如和 EMEET 壹秘合作的 PIXY 4K 超清双目 AI 智能云台摄像头，绝对是今年办公硬件赛道杀出来的最大黑马。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_28.pngoutput_28

它不仅能输出 4K、30fps 的超高清视频通话，搭载了通过 Zoom 认证的 AI 降噪算法，能完美过滤键盘敲击、开门关门这些办公室常见噪音；

更厉害的是它的 AI 自动跟拍功能 —— 不管你在会议室里走来走去讲 PPT，还是站在白板前写板书，镜头都会稳稳锁定你，永远把你放在画面 C 位。远程会议再也不用几个人挤在一个镜头前，也不用手忙脚乱地调角度了。

这款产品能卖爆的核心，就是它同时集成了聆思的语音和视觉双能力。

一颗 CSK6 芯片，同时搞定 AI 降噪和智能跟拍，不用再像以前那样分别用两颗芯片来处理音视频，不仅 BOM 成本直接砍了一半，还解决了多芯片之间的协同延迟问题，让整个设备的响应速度和稳定性都上了一个台阶。

再比如如今热度居高不下的 AI 陪伴机器人与互动玩具，正是多模态融合的典型代表。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_30.jpgoutput_30

它们既能流畅响应各类语音指令、依托大模型实现自然对话，还能依靠视觉能力精准跟随移动、识别动作表情。不管是日常聊天互动、趣味问答，还是感知情绪、陪伴玩乐，一台设备就能兼顾多重体验。

原本只是简单发声、被动执行指令的玩具与机器人，如今蜕变成了能看、能听、能互动的智能伙伴。这就是多模态融合带来的全新产品体验。

这些案例正在证明一个道理：AI 硬件的下一个增量，不是单一功能的升级，而是多模态能力的融合。

过去的智能硬件，要么只能听，要么只能看，交互方式非常单一。

未来的智能硬件，会同时具备语音、视觉、触觉等多种感知能力，能够更自然、更智能地和用户交互。它不再是一个被动执行指令的工具，而是一个主动理解用户需求的助手。

而聆思，是目前全行业唯一一个，能同时提供成熟语音和视觉方案的芯片公司。

别人需要两颗芯片、两个算法团队、半年开发周期才能实现的功能，它用一颗芯片、一套方案、一个月就能搞定。这就是无可比拟的竞争优势。

现在，已经有越来越多的厂商开始和聆思合作，探索多模态的可能性：

早教机器人，既能听懂孩子的问题，又能看懂孩子的绘本和表情
智能台灯，既能语音控制，又能识别孩子的坐姿，提醒矫正
智能厨房，既能语音导航菜谱，又能识别食材，自动调节火候

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_31.jpgoutput_31

AI 正在为传统硬件创造无限的创新空间。

而聆思，正在成为这个新时代的底层基础设施。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_32.pngoutput_32

所有人都在卷大模型，它走在了最前面

当整个行业都在为手机端侧大模型疯狂的时候，聆思又一次走在了前面。

聆思早已开启面向智能终端的端侧大模型专用芯片研发，将在今年年底推出。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_33.jpgoutput_33

现在所有人都在喊 “端侧大模型”，但 99% 的人都搞错了方向。

他们以为端侧大模型就是在手机上跑 ChatGPT，就是堆 10T、20T 的算力。

但实际上，端侧大模型最大的市场，根本不在手机上，而是在具身智能机器人、全屋智能家居、汽车座舱等为代表的海量终端。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_34.jpgoutput_34

AI 眼镜需要实时理解你看到的场景，给你提供即时的信息辅助；服务机器人需要理解家庭环境，识别物体和人物，自主完成家务任务。

但它们对芯片的要求也最苛刻：体积要小，功耗要低，成本要便宜，还要能同时处理语音和视觉数据。

而市面上绝大多数现有端侧 AI 芯片，根本满足不了这些要求。

这些芯片大多还是围绕传统 CNN 等轻量模型设计的，计算、存储和数据流架构完全没有针对 Transformer 特有的注意力机制、长序列依赖做原生优化。

有行业数据显示，用传统 CNN 加速器跑大模型推理，算力利用率甚至不到 1%—— 这也是为什么很多标称几十 TOPS 的芯片，实际跑大模型却卡得像幻灯片。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_35.pngoutput_35

更要命的是，大模型推理的真正瓶颈从来都不是标称的 TOPS 算力，而是内存带宽、缓存效率和数据重用能力 —— 这恰恰是传统端侧芯片的最大短板。

再加上终端设备在功耗、成本、芯片面积和散热上的极限约束，云端那套堆算力的架构根本不可能在端侧复制。想要让大模型真正走进亿万普通设备，必须在有限的物理边界内，重新构建一套兼顾能效比和成本的全新设计范式。

而这，恰恰是聆思最擅长的事。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_36.pngoutput_36

和其他公司 “先造大算力芯片再找活干” 的思路不同，聆思还是老路子：先搞清楚机器人和眼镜到底需要什么，再去设计芯片。

它没有盲目堆 TOPS，而是重点解决大模型推理最头疼的三个问题：内存带宽、能效比和多模态融合。采用面向大模型的原生架构，配合自研的模型压缩和推理引擎，目标是用低成本、高性价比的方案来实现流畅的 7B 大模型推理能力。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_37.pngoutput_37

如果这个目标能实现，将彻底改变整个行业的格局。

它将让大模型从手机、电脑这些高端设备，下沉到所有的智能终端中。到那时，我们身边的每一个设备，都将具备理解和思考的能力。

真正的智能时代，才会到来。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_38.pngoutput_38

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_39.pngoutput_39

中国芯片不需要第二个英伟达

很长一段时间里，我们都陷入了一种病态的执念：好像中国芯片只有做出自己的英伟达，只有追上 7nm、5nm 的先进制程，才算成功。

所有人都在追大算力、追高端市场、喊着 “干翻国际巨头”。

但聆思的故事告诉我们，中国芯片还有另一条路。

一条不需要最先进的光刻机，不需要和巨头正面硬刚的路。一条深耕场景、软硬协同、把用户真正需要的东西做到极致的路。

全球 AI 芯片市场，其实是一个三层金字塔：

塔尖是云端大算力，被英伟达垄断，后来者几乎没有机会；
中层是高端端侧，被高通、苹果把持，竞争异常激烈；
塔基是海量的消费电子、家电、教育硬件，市场规模是上层的好几倍，但长期被忽略。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_40.jpgoutput_40

而中国公司，最擅长的就是打塔基市场。

我们有全球最大的制造业基地，有最完整的产业链，有最庞大的消费市场。我们最懂普通消费者需要什么，我们能最快地响应市场的变化。

聆思没有去抢云端的蛋糕，而是扎根在别人看不起的端侧小算力市场，用六年时间，把 1.5 亿颗芯片装进了全世界的智能设备里。它没有喊过一句 “干翻英伟达”，但它实实在在地改变了我们的生活。

很多人到现在还以为，聆思只是一家做语音芯片的公司。

但他们不知道，这家公司已经悄悄完成了从语音到视觉，再到多模态大模型的技术跨越。它正在从一个单一的芯片供应商，变成一个端侧 AI 的平台级公司。

/Users/anya/Library/Containers/com.kingsoft.wpsoffice.mac/Data/tmp/picturecompress_20260604172242/output_41.pngoutput_41

中国不需要第二个英伟达。

中国需要 100 个聆思这样的公司。

它们不追风口，不炒概念，不讲故事，只是默默地把技术做到极致，把成本降到最低，把体验做到最好。

当所有人都在盯着云端的万亿大模型市场的时候，端侧的万亿市场已经被悄悄瓜分完了。

而那些闷声干大事的公司，终将走到舞台中央。

红海之上的新蓝海：没人注意到，聆思已经拿下了半个消费级 AI 视觉 | 前沿在线

Frontiers

Frontiers

相关文章

“家庭新成员”再升级， 商汤绝影正式发布可悠（Care U），首创全场景多设备协同智能终端

iCAR首发搭载地平线舱驾融合整车智能解决方案，星空芯片获十余家品牌合作意向

从“用系统”到“跑 Agent”：AI 钉钉 1.1 在重新定义企业操作系统 | 前沿在线

推荐阅读

“家庭新成员”再升级，商汤绝影正式发布可悠（Care U），首创全场景多设备协同智能终端