九卦 | 端侧范式变革：AI时代的“入口权”升维战

作者 | 陈庆春

来源 | 热AInext

OpenAI成立的初衷，是奥尔特曼与马斯克达成的一致：让全世界人民平等地享受AI带来的福利。几乎所有有理想的公司，发展AI的初衷都是如此。

但他们渐渐发现，一个文本对话框，已经无法全面体现AI的能力，更无法让AI触达所有人。AI需要一个身体，自己走到全世界人民面前。不一定是人形机器人，可以是各种形态的AI端侧产品，比如手机、PC、平板、眼镜，也可能是另一种我们现在还无法想象的全新形态。

在OpenAI发布ChatGPT的当年，奥尔特曼便开始着手设计适合生成式AI的端侧产品，直到今年5月，他不惜花费65亿美元，正式收购了Jony Ive创办的硬件公司io Products。因为，AI需要一个身体，乃至数个分身的需求，越来越迫切。

这封信发布于 OpenAI 官网，左为 John，右为奥尔特曼。

当大语言模型飞速迭代时，这种焦虑感就显得越发的沉重。究竟该如何快速地将顶级聪明的AI带给每一个人？

就在刚刚结束的一周，Meta、谷歌、微软、亚马逊、阿里巴巴、百度纷纷发布今年7-9月份的第三季度财报，出人意外的是，如同OpenAI一样，端侧产品、AI硬件产品却成为他们财报重点披露的对象，以及志在必得的业务领域。

这不是简单的“大家都想卖设备”，而是整个科技行业正在发生一次终端范式大迁移。是继大语言模型入口之后，大公司对于AI时代“入口权”的升维决斗。在这场新的决斗中，已经掌握了大规模硬件产品的企业，比如联想集团、苹果公司、三星，更有优势，还是掌握了基础大模型和系统入口的企业，更有优势？

AI需要一个身体

一提到“入口权”，在互联网时代，我们很自然地想到了PC，想到了联想、惠普、戴尔；在移动时代，则是苹果、三星、华为、小米。所有希望触达用户的任何能力（软件），只能依赖这些终端表层接入。苹果手机的过路费避之不及、逃之不掉，无时不刻不在提醒这个时代有一个入口，是苹果。

但生成式AI（GenAI）时代，入口发生了根本性变化，一个显著的特点是：我们可能不再需要App，而需要一个“随时随地可交互的智能体”。它就像你的分身，你的AI双胞胎，拥有你的记忆、思想以及超出你的智力。这个智能体像你一样，需要一个“物理身体”，必须能接触物理世界。如果AI只在云端：看不到你、听不到你、理解不了上下文、无法控制真实设备，不是你的AI分身、智能体，只是云端客服。如果AI借助硬件：理解你周围的物理世界、观察你正在做什么、实时帮你处理信息、代你执行设备操作&家庭设备操作、主动发现你需要什么。

那么，硬件就等于，智能体的“眼睛、耳朵、手脚以及存在方式”，其中涉及：麦克风（语音）、摄像头（视觉）、屏幕（反馈）、传感器（环境）、本地运行（隐私+ 低延迟）、常时在线（随时叫随时回应）。

谁控制硬件，谁控制这个智能体。才能实现所有大公司所设定的愿景：通过智能体及智能硬件，让AI 平等地惠及每一个人。

这种转变正在发生。中美科技巨头，已经将手伸向了智能硬件。

在美国

OpenAI

想创造一个全新的AI类别终端，弱化屏幕、强化“环境感知+对话”；

Amazon

把“家”当成一个巨大“AI机体”：音箱、中控屏、摄像头、门锁、机器人全部接Alexa+，同时手机优先，Pixel手机打造成“AI-first smartphone”，再把同样的Gemini能力向笔记本、XR扩散；

微软

希望让PC再活一轮：“不是换一台电脑，是换一类电脑（Copilot+ PC）”，

联想的AI PC

是它绑定的最大合作伙伴；

Meta

押注“眼镜+头显”路线，扎克伯格认为“长远来看，大家会戴AI眼镜，而不是掏手机”。

在中国

阿里巴巴

是最先在C端形成软硬通吃战略布局的互联网大佬，夸克眼镜是它的智能硬件触手，最近又将“通义APP”改成“千问APP”，对标ChatGPT，整合阿里旗下电商、物流等资源，一并装入硬件，形成统一入口；

百度

也已在智能眼镜、自动驾驶汽车等关键智能硬件上做了布局；

联想集团

本就是PC全球大佬的，更是早两年前就迈出了AI PC的步伐，目前AI PC在个人电脑总出货量中的占比已经超过30%，在全球Windows AI PC市场稳居第一，其在中国市场发布的“天禧个人超级智能体”，平均周活跃度已达到40%。

当然，这只是开始，撬开时代大门的一个支点。但为什么是现在？

因为端侧算力效率出现了革命性突破。如果把时间拨回3年前：

•本地设备算力跑不动大模型

•能跑模型的GPU重达几十公斤

•手机只具备一点点弱AI推理能力

•环境理解、长时记忆根本不可能本地完成

那时候，AI硬件设备是伪命题。但2023–2025年出现了三大突破，让“AI硬件设备”成为现实：

突破1：大模型从百亿参数→ 0.5–20B 端侧可跑的架构，轻量大语言模型和多模态Nano 模型纷纷出现，比如，Gemini Nano、Meta Llama 3.2 3B/11B、Qwen1.5 系列、Qwen3 系列以及OpenAI 曝出的On-device 模型计划，等等。这些模型可以在10–40 TOPS 的NPU 上流畅运行，让多模态能力（图像理解、语音、OCR）能端侧化，这意味着手机、PC、眼镜可以做以前必须云端做的事。

突破2：NPU/ AI加速器性能暴涨，约10倍级提升，2023年到2025年NPU增长速度堪比当年“GPU 起飞”。而且功耗极低，几瓦就能运行模型。比如高通X Elite 45 TOPS，苹果M4 38 TOPS，Google Tensor G4 30+ TOPS，AMD超50 TOPS，英特尔Lunar Lake 48 TOPS。这说明，AI不是云独占资源，已经“掉到”终端设备的芯片里了。

突破3：设备开始具备“持续感知”能力（实时摄像头+ 麦克风+ 传感器）。PC、手机、眼镜、耳机正在变成：无缝拾取语音，实时看到你看到的，理解环境，记住你的行为、偏好、历史，主动提醒、主动执行任务。设备第一次变成了“智能体容器”而不是“计算工具”。这就彻底改变了硬件的战略地位。

因此，此时此刻的当下，AI需要一个“身体”，也具备了拥有一个身体的条件，它可以控制硬件的方式走向这个广阔无垠的物理世界。那么，谁提供这个身体，谁就控制未来的入口。谁控制硬件，谁就控制了智能体。

一端还是多端？AI需要无数分身？

未来会不会出现一台AI超级终端，它像互联网时代的PC、移动时代的手机一样，几乎掌管整个时代？答案可能是否定的。

AI的未来不是一台超级终端，而是一个分布式的智能体系统。AI若只依赖一种设备，就注定不能成为“生活级智能体”。这不是技术问题，而是人类行为决定的。首先，人的生活天然是“多场景的”，人类每天的活动跨越：移动、工作、家庭、社交、休息。这些场景对“交互方式”的需求完全不同：在车里，声音与大屏最自然在户外，眼镜比手机更自然；在家，音箱比手机更自然；在工作区，PC比手机更高效；在运动时，耳机比手机更自然。单一设备无法覆盖人类所有生活场景。

其次，AI的本质是理解世界，而不是停在屏幕里——这决定了必须“多传感器、多终端”。没有任何单一设备能同时承担：低功耗监听，第一视角视觉，大屏处理，生理感知，家庭环境理解，运动中自然交互，驾驶场景交互。AI想“读懂你的一天”，必须依赖多个设备分布式地感知你。

让AI理解世界，每个设备必须承担不同能力：

•手机：主账号+输入输出中心

•眼镜：第一视角视觉

•耳机：低打扰语音入口

•PC：需要复杂操作的工作场景

•家庭设备：环境信息、持久感知

•可穿戴：生理与状态感知

这些分工与人类神经结构极其相似：不是一个器官负责全部，而是多器官协同。最自然的AI必须“融入场景，而不是集中在一台设备上”。

第三，还要考虑能耗、散热以及安全等细节问题。单设备无法解决能耗与散热问题，AI长时运行必须多终端分担。AI的耗能结构决定它必须分散到不同设备上，而不是强塞到一台里。

在隐私与安全方面：敏感任务必须端侧分布执行，而不是集中在一个设备里。没有人愿意把所有敏感数据集中在一台设备里处理。

传统交互，是“人找设备”。AI交互，是“设备找人”。把所有AI功能放进手机，是旧时代互联网的思维（App逻辑）。智能体时代的思维是“场景驱动”，不是“设备驱动”。

基于这个逻辑，OpenAI创始人奥尔特曼正在重新思考AI时代的硬件。OpenAI在官宣收购oi公司的时候，这样说到：“现在，计算机能够看见、思考和理解。尽管拥有这种前所未有的能力，我们的体验仍然受传统产品和界面的影响。”

奥尔特曼自己的判断是：“使用技术的含义可能会发生深刻的变化。我希望我们能带来一些30年前我初次使用苹果电脑时感受到的喜悦、奇迹和创造性精神。”

很巧合的是，就在奥尔特曼官宣之后不久。联想集团董事长、CEO杨元庆也发了一封语气急切的内部信，内部人士称，“元庆（联想内部都是直呼其名）特别担心高管们不能理解混合式人工智能战略。”但在外部人士看来，他更担心错过这个理应属于硬件厂家的最大时代机会。

这封内部信是这样说的：

“我们不应该满足于仅仅是单一设备（例如AI PC）、单一应用（例如服务机器人），甚至是单一生态（例如Copilot、Gemini）这样的智能，尽管它们都是我们通向个性化混合式人工智能的重要一部分，也可以说是重要的路径，比如AI PC现在能做到文生文、文生图，能够解决智能化的操作等等（例如智能控制、写作等等），Copilot也可以在它的PC生态甚至手机生态里做一些智能化的交互和应用，但这些东西都不应该是全部。我们既不能被一些假象迷惑而满足于此，比如认为Copilot就是个人智能，认为AI PC就是个人智能，更不能因为要向更高的高峰前行艰难而止步于此。

所以我们所向往的是，以人和企业为中心的智能，也就是所有的设备、应用、操作系统、生态都是服务于这个中心的，或者说AI是构筑于所有这些要素之上的，与人和企业更加息息相关的虚拟的存在，彷如你的替身、你的twin（人工智能双胞胎）。它甚至要求跨设备、跨应用、跨操作系统/生态的能力，和基于这样能力所形成的更多的原生应用方式，比如智能体。”

杨元庆急切的心情，真的是跃然纸上。可能你会觉得，将杨元庆与奥尔特曼放在一起，有种时代的错觉。但这个时代就是这样，给予了他们同样的硬件机会。

联想集团董事长兼CEO杨元庆

在2025联想创投CEO年会上分享下个 10 年的战略愿景

很多人猜测，OpenAI计划制造一个“超级终端”，但却遭遇一系列问题，单个终端算力问题、隐私问题、能耗问题，导致这个“超级终端”面世的时间一拖再拖。再加上，先前Humane的AI Pin、Rabbit的r1产品，都试图用一个“超级终端”颠覆硬件产品，却已纷纷失败。奥尔特曼或许也应该像他自己所说的，要转变思路。

一个很明显的事实：AI不会取代设备，而是让所有设备“变成你的智能体身体”。未来的AI不是靠某一台超级终端，而是依靠你身边所有设备共同组成“数字身体”。未来不是“AI手机统治世界”。

未来是：一个云端大脑+多端小脑+多端传感器+多端交互器官，共同组成你的AI智能体。谁能把这套系统打包好、协调好、并做到体验无缝，谁就赢下下一代科技平台。

大厂角逐“AI多端”，谁的赢面大？

手机、眼镜、家、车、机器人等等智能硬件，如何连成统一的智能体体验？

联想杨元庆的答案是，以人为核心，跨设备、跨应用、跨操作系统/生态地建立个人智能体，即所谓的“一体多端”战略。这个智能体，联想在中国称之为“天禧超级智能体”，在中国之外称之为“AI Now” 。谷歌称之为“Alexa+”。小米要建的“人车家”生态，也与该逻辑一致。

他们共同的特点就是要给分散在各终端硬件的智能体，建立一个智能体网络，将多个硬件拼凑出一个“AI人”的完整体验。

可以简单做个比喻，超级智能体相当于一个人的AI双胞胎，也就是AI化的“人”，而分散在各个智能硬件中的个人智能体，相当于这个“AI人”的无数个分身。超级智能体就负责控制、连接、调度这些硬件分身，这整个过程都要基于云端算力、端侧硬件算力、大模型算法以及连接协议来进行，也可以统称为智能体网络。

从技术落地来看，要做好完整的智能体体验，至少需要这样几个关键技术：1、“云端大脑+端侧小脑”的调度系统；2、跨设备任务接力和会话连续性；3、端侧算力基础，要多终端协同，每台设备要有自理能力；4、安全、权限与隐私框架；5、开发者API和跨设备SDK；6、最后，要统一身份和设备图谱，同一个账号下，系统要知道：你有哪些设备、现在在线的是哪几台、彼此离多远。

基于以上的技术框架，再来看大厂这次在“AI多端”的角逐，输赢便可一目了然了。

首先，是否有能力完成多端算力和云端算力，以及公共大模型、端侧个人大模型的调度？也就是，什么时候在本地跑AI、什么时候丢给云端大模型，而且要让所有设备看到同一份“人格”和记忆。这一层，本质是在做“一个人格，多设备入口”的调度。

这属于最顶层的设计，就需要建立一个混合式人工智能架构。一来完成调度，二来保证隐私安全、可信计算。对于大厂来说，这几乎不是难事，谷歌、Meta、OpenAI、阿里巴巴、联想集团等等都是混合式人工智能架构。

其次，覆盖场景越多，多端计算及协同能力越强，赢面是否越大？如前所述，AI需要多个硬件理解物理世界，智能体时代的思维是“场景驱动”。只有多场景，AI拿到的数据才是完整的，才能剔除幻觉，获得更精准的答案。在全球范围内，能同时覆盖PC +手机+平板+ XR的，其实只剩：Apple、三星、Google（理论上可行，但手机端体量太弱）和联想（全球出货规模能和三星比肩）。这里不得不重点提到，联想具备天然的“多端生态图谱”基础。这是许多AI创业公司、甚至传统互联网公司都不具备的。

•AI PC（ThinkPad、Yoga、Legion）

•手机（Motorola）

•平板（Tab系列）

•可穿戴（Moto Watch）

•VR/AR（联想ThinkReality系列）

•家庭IoT

更值得关注的是2B的端侧能力。我们大多数人都是企业人，在企业工作基本需要专用的PC、会议设备、工作站、显示大屏、移动办公平板等等。只有将这些都连接起来，才是一个完整的“AI人”的轨迹和数据画像。

所以，那些具备B端硬件能力的大厂，可能更有优势。

无论是2C还是2B，要做大规模，都需要将端侧硬件体验做到极致，并拥有很强的供应链和渠道壁垒。一个反例是：谷歌，做硬件近10年，依然无法把硬件规模做上去，Pixel是“工程师眼中的理想手机”，但谷歌不是一个“卖硬件的公司”。Pixel就算再好，也只能引领风向而不是吃市场。供应链、质控、维修体系都与联想这样的规模的制造商比起来，差距巨大。

但并不意味着谷歌做不好AI硬件，今年Pixel 10系列手机的市场反响就很好。谷歌还有专属的Tensor芯片、强大的Gemini基础大模型、系统定义权，以及非常完备的终端产品线，包括：Nest系列智能家居设备、平板电脑、电视、无线耳机、AI眼镜，等等。联想集团要在世界范围内与谷歌对垒，其制造供应链的优势能有多大胜算，其实不好说。

再比如亚马逊，在大模型时代，看似很低调，但实际上野心更大。今年亚马逊用大模型全面升级了Echo系列以及Ring、Blink、Eero安防监控系列，和Astro家用机器人，并发布了新一代Alexa+，是基于大模型的新Alexa，强调更自然的对话、多步任务和个性化记忆。更重要的是，经过多年积累，亚马逊已经拥有几亿台Alexa设备装机量，只要Alexa+的体验够好，它的AI硬件升级几乎是“顺滑升级”，门槛比OpenAI那种新物种要低得多，成功概率相对较高。

按照杨元庆的战略规划及愿景，联想集团未来真正的对手不是三星、苹果、华为，反而恰恰就是亚马逊、谷歌，这些软硬通吃的生态型企业。这是联想的机会，也是联想的挑战。我们当然希望中国企业能赢。最后，大厂角逐“多终端”，是否拥有跨系统、跨终端、跨阵营的开放开源能力？在移动时代，苹果很轻松地用手机、PC、平板、手表就实现了闭环体验，但在大模型时代，这几个端已无法满足个体AI的个性化需求。所以，拥有完整体验的个体AI，必须跨系统、跨终端、跨阵营的开放开源。

曾被诟病为'大杂烩'的联想，反而此时有了优势。目前，联想的Smart Connect技术，可以轻松跨平台，如：Windows（主力PC）、Android（平板、手机）、ChromeOS（海外教育市场）、AR/VR自有方案、IoT设备。联想能够天然占据Windows + Android的跨系统多终端协同主场。这是Apple和Google都无法替代的角色。

这种优势已经体现在联想集团的最新财报中：其一，在AI驱动下，整体营收和利润仍保持双位数同比增长，特别是净利润同比增长25%；其二，AI终端设备营收，在联想整个的智能硬件业务（IDG）营收中的占比大幅提升至36%，同比提升17个百分点，已成为最具结构性意义的增长引擎之一。AI PC更是改写了全球PC增长停滞的大局面，也令联想PC全球市场份额首次突破25%，领先第二名5.7个百分点，市场支配力继续扩大。

每个时代都有每个时代的企业。未来10年，联想将是PC入口、企业入口、多端协同中枢入口的强劲竞争者之一。

附：八大巨头 AI 硬件战略大比拼

DC娱乐网

九卦 | 端侧范式变革：AI时代的“入口权”升维战

热门分类