2025 年 7 月 14 日,广州,一场峰会之后,《中国端侧 AI 全景图谱报告》发布。三天后,7 月 17 日,上海,《中国人工智能应用发展报告(2025)》出炉。
两份报告前后脚亮相,前者把目光钉在“芯片—模型—终端—应用”这一狭长链条,后者俯瞰金融、制造、教育、医疗等千行百业。把它们并排摊开,一条清晰的时间线浮现出来:中国 AI 正在离开数据中心,走向每一台小设备,也走向每一个小场景。
在前一篇《超4000亿!美国AI初创公司融资流向、赛道与逻辑全曝光(附一览表)》里老邪写到,美国的资本在流向算力、数据、场景和入口,估值也随之一浪高过一浪,相比之下,我们来深究中国 AI 的下一步,为什么会是从云端到指尖。
01 为什么 AI 必须离开云端
过去十年,AI 靠堆算力、堆参数一路狂奔。这条路把模型做得越来越大,也把成本抬得越来越高。企业发现,只要模型还在云端,每一次调用都要付租金,每一次升级都要换更贵的卡。DeepSeek 的出现像一次提醒:如果推理成本降不下来,再聪明的模型也落不了地。
于是,行业把目光投向终端——手机、眼镜、机器人、传感器……这些设备数量多、分布广,却受制于电池、体积和散热。AI 要在它们体内活下来,必须同时满足“算得动、耗得少、装得下”。一句话,云端做训练,端侧做推理,成了唯一可行的分工。
02 端侧 AI 的“四块拼图”
《全景图谱》把端侧 AI 拆成四块拼图:芯片、模型、终端、应用。四块拼图的顺序,就是价值兑现的顺序。
芯片
2024 年起,各家厂商先后发布 3nm 制程的端侧 SoC。更小的制程带来更低的功耗,也让 CPU、GPU、NPU 可以挤在同一颗硅片上。芯片厂下一步的 KPI 不再是跑分,而是“每瓦准确率”。
模型
当芯片把功耗锁死,模型就需要“瘦身”。剪枝、量化、蒸馏三种手段齐下,把 100 亿参数压到 10 亿,再压到 1 亿。2025 年 6 月,国内三家初创公司几乎同时发布 7B 参数的“端侧专用大模型”,在限定功耗下的推理速度首次追平云端。
终端
芯片和模型就位,终端厂商才敢动手。AI 手机、AI PC、AI 眼镜在 2025 年二季度集中上市。它们的共同点是:本地推理、离线可用、数据不出设备。消费者第一次感到 AI 不再依赖网络,体验顺滑得像本地计算器。
应用
当终端规模突破千万台,应用层的机会才到来。教育笔电、陪伴机器人、工业相机开始内嵌轻量大模型,用“听得懂、看得见、答得上”取代传统的固定程序。应用开发者不再需要租 GPU,只要调用终端自带的 NPU,就能把创意变成产品。
03 从“技术三角”到“商业三角”
《全景图谱》提出“算力×通信×存储”的三角定律。把它翻译成商业语言,就是:
- 算力决定能不能跑;
- 通信决定要不要跑;
- 存储决定跑多久。
三者一旦失衡,商业模式就立不住。2024 年,一家做 AI 翻译眼镜的公司把模型放进眼镜腿,结果通信模块耗电比 NPU 还高,用户戴两小时就烫耳朵,项目被迫回炉。2025 年,他们砍掉实时云端同步,只保留必要时的 4G 回退,续航立刻从两小时提升到八小时,产品这才开始起量。
04 千行百业的“五新”落地
《应用发展报告》用 1500 份问卷和 100 家龙头企业访谈,总结出 AI 落地的五种新形态:效率工具、服务体验、产品形态、决策助手、科研模式。它们的共同特征是“轻、快、省”。
- 轻:模型小,跑在终端;
- 快:本地推理,毫秒级响应;
- 省:一次购买,长期免费使用,不再按调用量付费。
以汽车制造为例,2024 年主流方案是把激光雷达数据上传到云端做质检,一条产线一天产生 200GB 流量。2025 年,工业相机里塞进一颗 5W 的 NPU,数据就地处理,只把异常图片回传,流量降到 2GB,带宽费用一年省下 120 万元。
05 投资逻辑的变化:从“更大”到“更省”
投资人看 AI 的角度也在变。2023 年,大家比谁的模型参数多;2024 年,比谁的融资多;到了 2025 年,问题变成“每花一元钱,能带来几元回报”。
《应用发展报告》给出四力评估:技术创新力、资金吸引力、市场渗透力、业务价值力。其中“业务价值力”权重最高。简单说,技术再炫,也要在财报里找到落脚点。
一家做 AI 陪伴玩具的公司在 2024 年底融资时,被问到“如果 OpenAI 降价你怎么办”。创始人把玩具拆开,现场演示离线运行,无需联网就能陪小朋友聊天。投资人当场拍板,原因很简单:成本可控,护城河不在云端,而在终端的硬件和算法耦合。
06 “具身智能体”:终端的下一站
两份报告都提到同一个词——具身智能体。它听起来晦涩,翻译成日常语言就是:设备不再只是工具,而是能看、能听、能动的伙伴。
- 情感接口:它叫你“小周”,而不是“用户 12345”;
- 感知能力:它知道你今天加班到很晚,自动把灯光调成暖色;
- 行为自主:它发现你明早要出差,夜里偷偷把登机牌打印好放在玄关。
要实现这些场景,芯片、模型、终端、应用必须再向前一步:芯片要更低功耗,模型要更小更聪明,终端要更像“身体”,应用要像“习惯”。时间线上,2025 年只是起点,真正的拐点可能在 2027 年,当端侧设备年出货量突破 10 亿台,生态才会完全成熟。
07 政策与资本:两条并行的护航线
两份报告都提到“教育筑基、创新驱动、治理护航、资本赋能、生态协同”五位一体。翻译成行动,就是:
- 教育:高校把 AI 课程下沉到高职,半年内培养十万名“端侧模型优化师”;
- 治理:2025 年 4 月起,所有带摄像头的端侧设备必须通过本地隐私认证,数据不能出境;
- 资本:政府母基金拿出 100 亿元,专门补贴把模型做小、做省电的项目,补贴按“每降低 1 毫瓦奖 1 元”计算。
政策给出规则,资本给出奖励,企业才敢把研发预算从云端转向终端。
08 未来三年时间表
我们把两份报告的信息整合起来看,可以画出一张简洁的时间表:
- 2025 Q3:第一批 3nm 端侧芯片量产,AI 手机秋季集中上市。
- 2025 Q4:7B 参数端侧模型成为主流,开发者不再依赖云端 GPU。
- 2026 Q2:千万级出货带动应用爆发,教育、陪伴、工业三大场景跑出三家独角兽。
- 2026 Q4:具身智能体概念产品首次亮相,售价万元级,销量十万台。
- 2027 全年:端侧设备年出货量突破 10 亿台,AI 真正无处不在。
结语:AI 的终点不是技术,而是日常
十年前,AI 在实验室里识别猫狗;五年前,AI 在云端写诗作画;今天,AI 钻进每个人的口袋、手腕、桌面。两份报告用不同维度讲同一个故事:技术只有变小、变省、变贴近,才能从展品变成用品。
当芯片功耗降到毫瓦级,当模型压缩到亿级参数,当终端年出货量突破十亿台,AI 不再是新闻里的大新闻,而是夜里那盏自动亮起的灯、早上那张悄悄打印好的登机牌。到了那一天,没有人会再讨论“AI 会不会改变世界”,因为改变已经完成。
AI相关热门内容推荐:
- 打造AI最爱的高质量数据集 这份指南让你的模型不跑偏 上
- 打造AI最爱的高质量数据集 这份指南让你的模型不跑偏 下
- 从“民工”到“AI训练师”:数据标注行业背后的逆袭之路
- 从地方到央企:我国数据产业打响“抢矿”“炼油”争夺战
- 解码人工智能行业应用统一参考架构 助力高质量发展
来源:物联网智库、央视频,本篇针对全文结合生成式 AI 做出的核心摘要和解答,仅作为参考,请以原文为准。图片:Mockuuups,Unsplash
碎片化学习,上 shuzhi.me !数智有你,一课开启:
- 一听微课堂破解“学用脱节”:留存率能做到81%
- 二问微学习培养“即插即用”:完课率能达到78%
- 三维微专业实现“产研融合”:在2周内完成迭代
所有课件、题库、问答基于海光认证iDTM+DeepSeek R1应用生成。免改免维云上多端AI透明化终身学习,现在我的台我来站!