DC娱乐网

九卦 | 端侧范式变革:AI时代的“入口权”升维战

作 者 | 陈庆春来 源 | 热AInextOpenAI成立的初衷,是奥尔特曼与马斯克达成的一致:让全世界人民平等地享受

作 者 | 陈庆春

来 源 | 热AInext

OpenAI成立的初衷,是奥尔特曼与马斯克达成的一致:让全世界人民平等地享受AI带来的福利。几乎所有有理想的公司,发展AI的初衷都是如此。

但他们渐渐发现,一个文本对话框,已经无法全面体现AI的能力,更无法让AI触达所有人。AI需要一个身体,自己走到全世界人民面前。不一定是人形机器人,可以是各种形态的AI端侧产品,比如手机、PC、平板、眼镜,也可能是另一种我们现在还无法想象的全新形态。

在OpenAI发布ChatGPT的当年,奥尔特曼便开始着手设计适合生成式AI的端侧产品,直到今年5月,他不惜花费65亿美元,正式收购了Jony Ive创办的硬件公司io Products。因为,AI需要一个身体,乃至数个分身的需求,越来越迫切。

这封信发布于 OpenAI 官网,左为 John,右为奥尔特曼。

当大语言模型飞速迭代时,这种焦虑感就显得越发的沉重。究竟该如何快速地将顶级聪明的AI带给每一个人?

就在刚刚结束的一周,Meta、谷歌、微软、亚马逊、阿里巴巴、百度纷纷发布今年7-9月份的第三季度财报,出人意外的是,如同OpenAI一样,端侧产品、AI硬件产品却成为他们财报重点披露的对象,以及志在必得的业务领域。

这不是简单的“大家都想卖设备”,而是整个科技行业正在发生一次终端范式大迁移。是继大语言模型入口之后,大公司对于AI时代“入口权”的升维决斗。在这场新的决斗中,已经掌握了大规模硬件产品的企业,比如联想集团、苹果公司、三星,更有优势,还是掌握了基础大模型和系统入口的企业,更有优势?

AI需要一个身体

一提到“入口权”,在互联网时代,我们很自然地想到了PC,想到了联想、惠普、戴尔;在移动时代,则是苹果、三星、华为、小米。所有希望触达用户的任何能力(软件),只能依赖这些终端表层接入。苹果手机的过路费避之不及、逃之不掉,无时不刻不在提醒这个时代有一个入口,是苹果。

但生成式AI(GenAI)时代,入口发生了根本性变化,一个显著的特点是:我们可能不再需要App,而需要一个“随时随地可交互的智能体”。它就像你的分身,你的AI双胞胎,拥有你的记忆、思想以及超出你的智力。这个智能体像你一样,需要一个“物理身体”,必须能接触物理世界。如果AI只在云端:看不到你、听不到你、理解不了上下文、无法控制真实设备,不是你的AI分身、智能体,只是云端客服。如果AI借助硬件:理解你周围的物理世界、观察你正在做什么、实时帮你处理信息、代你执行设备操作&家庭设备操作、主动发现你需要什么。

那么,硬件就等于,智能体的“眼睛、耳朵、手脚以及存在方式”,其中涉及:麦克风(语音)、摄像头(视觉)、屏幕(反馈)、传感器(环境)、本地运行(隐私+ 低延迟)、常时在线(随时叫随时回应)。

谁控制硬件,谁控制这个智能体。才能实现所有大公司所设定的愿景:通过智能体及智能硬件,让AI 平等地惠及每一个人。

这种转变正在发生。中美科技巨头,已经将手伸向了智能硬件。

在美国

OpenAI

想创造一个全新的AI类别终端,弱化屏幕、强化“环境感知+对话”;

Amazon

把“家”当成一个巨大“AI机体”:音箱、中控屏、摄像头、门锁、机器人全部接Alexa+,同时手机优先,Pixel手机打造成“AI-first smartphone”,再把同样的Gemini能力向笔记本、XR扩散;

微软

希望让PC再活一轮:“不是换一台电脑,是换一类电脑(Copilot+ PC)”,

联想的AI PC

是它绑定的最大合作伙伴;

Meta

押注“眼镜+头显”路线,扎克伯格认为“长远来看,大家会戴AI眼镜,而不是掏手机”。

在中国

阿里巴巴

是最先在C端形成软硬通吃战略布局的互联网大佬,夸克眼镜是它的智能硬件触手,最近又将“通义APP”改成“千问APP”,对标ChatGPT,整合阿里旗下电商、物流等资源,一并装入硬件,形成统一入口;

百度

也已在智能眼镜、自动驾驶汽车等关键智能硬件上做了布局;

联想集团

本就是PC全球大佬的,更是早两年前就迈出了AI PC的步伐,目前AI PC在个人电脑总出货量中的占比已经超过30%,在全球Windows AI PC市场稳居第一,其在中国市场发布的“天禧个人超级智能体”,平均周活跃度已达到40%。

当然,这只是开始,撬开时代大门的一个支点。但为什么是现在?

因为端侧算力效率出现了革命性突破。如果把时间拨回3年前:

•本地设备算力跑不动大模型

•能跑模型的GPU重达几十公斤

•手机只具备一点点弱AI推理能力

•环境理解、长时记忆根本不可能本地完成

那时候,AI硬件设备是伪命题。但2023–2025年出现了三大突破,让“AI硬件设备”成为现实:

突破1:大模型从百亿参数→ 0.5–20B 端侧可跑的架构,轻量大语言模型和多模态Nano 模型纷纷出现,比如,Gemini Nano、Meta Llama 3.2 3B/11B、Qwen1.5 系列、Qwen3 系列以及OpenAI 曝出的On-device 模型计划,等等。这些模型可以在10–40 TOPS 的NPU 上流畅运行,让多模态能力(图像理解、语音、OCR)能端侧化,这意味着手机、PC、眼镜可以做以前必须云端做的事。

突破2:NPU/ AI加速器性能暴涨,约10倍级提升,2023年到2025年NPU增长速度堪比当年“GPU 起飞”。 而且功耗极低,几瓦就能运行模型。比如高通X Elite 45 TOPS,苹果M4 38 TOPS,Google Tensor G4 30+ TOPS,AMD超50 TOPS,英特尔Lunar Lake 48 TOPS。这说明,AI不是云独占资源,已经“掉到”终端设备的芯片里了。

突破3:设备开始具备“持续感知”能力(实时摄像头+ 麦克风+ 传感器)。PC、手机、眼镜、耳机正在变成:无缝拾取语音,实时看到你看到的,理解环境,记住你的行为、偏好、历史,主动提醒、主动执行任务。设备第一次变成了“智能体容器”而不是“计算工具”。这就彻底改变了硬件的战略地位。

因此,此时此刻的当下,AI需要一个“身体”,也具备了拥有一个身体的条件,它可以控制硬件的方式走向这个广阔无垠的物理世界。那么,谁提供这个身体,谁就控制未来的入口。谁控制硬件,谁就控制了智能体。

一端还是多端?AI需要无数分身?

未来会不会出现一台AI超级终端,它像互联网时代的PC、移动时代的手机一样,几乎掌管整个时代?答案可能是否定的。

AI的未来不是一台超级终端,而是一个分布式的智能体系统。AI若只依赖一种设备,就注定不能成为“生活级智能体”。这不是技术问题,而是人类行为决定的。首先,人的生活天然是“多场景的”,人类每天的活动跨越:移动、工作、家庭、社交、休息。这些场景对“交互方式”的需求完全不同:在车里,声音与大屏最自然在户外,眼镜比手机更自然;在家,音箱比手机更自然;在工作区,PC比手机更高效;在运动时,耳机比手机更自然。单一设备无法覆盖人类所有生活场景。

其次,AI的本质是理解世界,而不是停在屏幕里——这决定了必须“多传感器、多终端”。没有任何单一设备能同时承担:低功耗监听,第一视角视觉,大屏处理,生理感知,家庭环境理解,运动中自然交互,驾驶场景交互。AI想“读懂你的一天”,必须依赖多个设备分布式地感知你。

让AI理解世界,每个设备必须承担不同能力:

•手机:主账号+输入输出中心

•眼镜:第一视角视觉

•耳机:低打扰语音入口

•PC:需要复杂操作的工作场景

•家庭设备:环境信息、持久感知

•可穿戴:生理与状态感知

这些分工与人类神经结构极其相似:不是一个器官负责全部,而是多器官协同。最自然的AI必须“融入场景,而不是集中在一台设备上”。

第三,还要考虑能耗、散热以及安全等细节问题。单设备无法解决能耗与散热问题,AI长时运行必须多终端分担。AI的耗能结构决定它必须分散到不同设备上,而不是强塞到一台里。

在隐私与安全方面:敏感任务必须端侧分布执行,而不是集中在一个设备里。没有人愿意把所有敏感数据集中在一台设备里处理。

传统交互,是“人找设备”。AI交互,是“设备找人”。把所有AI功能放进手机,是旧时代互联网的思维(App逻辑)。智能体时代的思维是“场景驱动”,不是“设备驱动”。

基于这个逻辑,OpenAI创始人奥尔特曼正在重新思考AI时代的硬件。OpenAI在官宣收购oi公司的时候,这样说到:“现在,计算机能够看见、思考和理解。尽管拥有这种前所未有的能力,我们的体验仍然受传统产品和界面的影响。”

奥尔特曼自己的判断是:“使用技术的含义可能会发生深刻的变化。我希望我们能带来一些30年前我初次使用苹果电脑时感受到的喜悦、奇迹和创造性精神。”

很巧合的是,就在奥尔特曼官宣之后不久。联想集团董事长、CEO杨元庆也发了一封语气急切的内部信,内部人士称,“元庆(联想内部都是直呼其名)特别担心高管们不能理解混合式人工智能战略。”但在外部人士看来,他更担心错过这个理应属于硬件厂家的最大时代机会。

这封内部信是这样说的:

“我们不应该满足于仅仅是单一设备(例如AI PC)、单一应用(例如服务机器人),甚至是单一生态(例如Copilot、Gemini)这样的智能,尽管它们都是我们通向个性化混合式人工智能的重要一部分,也可以说是重要的路径,比如AI PC现在能做到文生文、文生图,能够解决智能化的操作等等(例如智能控制、写作等等),Copilot也可以在它的PC生态甚至手机生态里做一些智能化的交互和应用,但这些东西都不应该是全部。我们既不能被一些假象迷惑而满足于此,比如认为Copilot就是个人智能,认为AI PC就是个人智能,更不能因为要向更高的高峰前行艰难而止步于此。

所以我们所向往的是,以人和企业为中心的智能,也就是所有的设备、应用、操作系统、生态都是服务于这个中心的,或者说AI是构筑于所有这些要素之上的,与人和企业更加息息相关的虚拟的存在,彷如你的替身、你的twin(人工智能双胞胎)。它甚至要求跨设备、跨应用、跨操作系统/生态的能力,和基于这样能力所形成的更多的原生应用方式,比如智能体。”

杨元庆急切的心情,真的是跃然纸上。可能你会觉得,将杨元庆与奥尔特曼放在一起,有种时代的错觉。但这个时代就是这样,给予了他们同样的硬件机会。

联想集团董事长兼CEO杨元庆

在2025联想创投CEO年会上分享下个 10 年的战略愿景

很多人猜测,OpenAI计划制造一个“超级终端”,但却遭遇一系列问题,单个终端算力问题、隐私问题、能耗问题,导致这个“超级终端”面世的时间一拖再拖。再加上,先前Humane的AI Pin、Rabbit的r1产品,都试图用一个“超级终端”颠覆硬件产品,却已纷纷失败。奥尔特曼或许也应该像他自己所说的,要转变思路。

一个很明显的事实:AI不会取代设备,而是让所有设备“变成你的智能体身体”。未来的AI不是靠某一台超级终端,而是依靠你身边所有设备共同组成“数字身体”。未来不是“AI手机统治世界”。

未来是:一个云端大脑+多端小脑+多端传感器+多端交互器官,共同组成你的AI智能体。谁能把这套系统打包好、协调好、并做到体验无缝,谁就赢下下一代科技平台。

大厂角逐“AI多端”,谁的赢面大?

手机、眼镜、家、车、机器人等等智能硬件,如何连成统一的智能体体验?

联想杨元庆的答案是,以人为核心,跨设备、跨应用、跨操作系统/生态地建立个人智能体,即所谓的“一体多端”战略。这个智能体,联想在中国称之为“天禧超级智能体”,在中国之外称之为“AI Now” 。谷歌称之为“Alexa+”。小米要建的“人车家”生态,也与该逻辑一致。

他们共同的特点就是要给分散在各终端硬件的智能体,建立一个智能体网络,将多个硬件拼凑出一个“AI人”的完整体验。

可以简单做个比喻,超级智能体相当于一个人的AI双胞胎,也就是AI化的“人”,而分散在各个智能硬件中的个人智能体,相当于这个“AI人”的无数个分身。超级智能体就负责控制、连接、调度这些硬件分身,这整个过程都要基于云端算力、端侧硬件算力、大模型算法以及连接协议来进行,也可以统称为智能体网络。

从技术落地来看,要做好完整的智能体体验,至少需要这样几个关键技术:1、“云端大脑+端侧小脑”的调度系统;2、跨设备任务接力和会话连续性;3、端侧算力基础,要多终端协同,每台设备要有自理能力;4、安全、权限与隐私框架;5、开发者API和跨设备SDK;6、最后,要统一身份和设备图谱,同一个账号下,系统要知道:你有哪些设备、现在在线的是哪几台、彼此离多远。

基于以上的技术框架,再来看大厂这次在“AI多端”的角逐,输赢便可一目了然了。

首先,是否有能力完成多端算力和云端算力,以及公共大模型、端侧个人大模型的调度?也就是,什么时候在本地跑AI、什么时候丢给云端大模型,而且要让所有设备看到同一份“人格”和记忆。这一层,本质是在做“一个人格,多设备入口”的调度。

这属于最顶层的设计,就需要建立一个混合式人工智能架构。一来完成调度,二来保证隐私安全、可信计算。对于大厂来说,这几乎不是难事,谷歌、Meta、OpenAI、阿里巴巴、联想集团等等都是混合式人工智能架构。

其次,覆盖场景越多,多端计算及协同能力越强,赢面是否越大?如前所述,AI需要多个硬件理解物理世界,智能体时代的思维是“场景驱动”。只有多场景,AI拿到的数据才是完整的,才能剔除幻觉,获得更精准的答案。在全球范围内,能同时覆盖PC +手机+平板+ XR的,其实只剩:Apple、三星、Google(理论上可行,但手机端体量太弱)和联想(全球出货规模能和三星比肩)。这里不得不重点提到,联想具备天然的“多端生态图谱”基础。这是许多AI创业公司、甚至传统互联网公司都不具备的。

•AI PC(ThinkPad、Yoga、Legion)

•手机(Motorola)

•平板(Tab系列)

•可穿戴(Moto Watch)

•VR/AR(联想ThinkReality系列)

•家庭IoT

更值得关注的是2B的端侧能力。我们大多数人都是企业人,在企业工作基本需要专用的PC、会议设备、工作站、显示大屏、移动办公平板等等。只有将这些都连接起来,才是一个完整的“AI人”的轨迹和数据画像。

所以,那些具备B端硬件能力的大厂,可能更有优势。

无论是2C还是2B,要做大规模,都需要将端侧硬件体验做到极致,并拥有很强的供应链和渠道壁垒。一个反例是:谷歌,做硬件近10年,依然无法把硬件规模做上去,Pixel是“工程师眼中的理想手机”,但谷歌不是一个“卖硬件的公司”。Pixel就算再好,也只能引领风向而不是吃市场。供应链、质控、维修体系都与联想这样的规模的制造商比起来,差距巨大。

但并不意味着谷歌做不好AI硬件,今年Pixel 10系列手机的市场反响就很好。谷歌还有专属的Tensor芯片、强大的Gemini基础大模型、系统定义权,以及非常完备的终端产品线,包括:Nest系列智能家居设备、平板电脑、电视、无线耳机、AI眼镜,等等。联想集团要在世界范围内与谷歌对垒,其制造供应链的优势能有多大胜算,其实不好说。

再比如亚马逊,在大模型时代,看似很低调,但实际上野心更大。今年亚马逊用大模型全面升级了Echo系列以及Ring、Blink、Eero安防监控系列,和Astro家用机器人,并发布了新一代Alexa+,是基于大模型的新Alexa,强调更自然的对话、多步任务和个性化记忆。更重要的是,经过多年积累,亚马逊已经拥有几亿台Alexa设备装机量,只要Alexa+的体验够好,它的AI硬件升级几乎是“顺滑升级”,门槛比OpenAI那种新物种要低得多,成功概率相对较高。

按照杨元庆的战略规划及愿景,联想集团未来真正的对手不是三星、苹果、华为,反而恰恰就是亚马逊、谷歌,这些软硬通吃的生态型企业。这是联想的机会,也是联想的挑战。我们当然希望中国企业能赢。最后,大厂角逐“多终端”,是否拥有跨系统、跨终端、跨阵营的开放开源能力?在移动时代,苹果很轻松地用手机、PC、平板、手表就实现了闭环体验,但在大模型时代,这几个端已无法满足个体AI的个性化需求。所以,拥有完整体验的个体AI,必须跨系统、跨终端、跨阵营的开放开源。

曾被诟病为'大杂烩'的联想,反而此时有了优势。目前,联想的Smart Connect技术,可以轻松跨平台,如:Windows(主力PC)、Android(平板、手机)、ChromeOS(海外教育市场)、AR/VR自有方案、IoT设备。联想能够天然占据Windows + Android的跨系统多终端协同主场。这是Apple和Google都无法替代的角色。

这种优势已经体现在联想集团的最新财报中:其一,在AI驱动下,整体营收和利润仍保持双位数同比增长,特别是净利润同比增长25%;其二,AI终端设备营收,在联想整个的智能硬件业务(IDG)营收中的占比大幅提升至36%,同比提升17个百分点,已成为最具结构性意义的增长引擎之一。AI PC更是改写了全球PC增长停滞的大局面,也令联想PC全球市场份额首次突破25%,领先第二名5.7个百分点,市场支配力继续扩大。

每个时代都有每个时代的企业。未来10年,联想将是PC入口、企业入口、多端协同中枢入口的强劲竞争者之一。

附:八大巨头 AI 硬件战略大比拼