DC娱乐网

最近,在巴塞罗那世界移动通信大会上,一款机器人手机技惊四座:手机顶部悄然伸出个摄

最近,在巴塞罗那世界移动通信大会上,一款机器人手机技惊四座:手机顶部悄然伸出个摄像头,跟随用户指令灵活转动、点头示意。智能手机发展至今,我们见证了运算速度的提升、机身厚度的压缩、影像能力的飞跃,但还是第一次见到手机长出“手脚”动起来。本该在手里为你“服务”的AI,突破了屏幕的边界,从会聊天的“数字助手”,进化为有“身体”、会“干活儿”、能够“适应”真实场景的智能实体。

2023 年以来,大模型技术爆发让 AI 具备了强大的语言理解和生成能力,但人们意识到一个问题:AI 在屏幕里能够对话、解答和生成内容,却不能在现实场景里完成具体的任务,例如当我们想要AI协助完成拍摄、跟拍、视角调整、场景交互这类任务时,手机里的AI往往“爱莫能助”。这种需求催生了机器人手机。

智能手机的“进化”可不是单一技术的突破,而是多项技术体系的协同成果,像具身智能、端侧大模型、AI 智能体和端云协同,技术合力让AI从虚拟跨越到现实。具身智能系统赋予 AI 感知环境和执行动作的能力,形成“感知—决策—执行”的完整闭环。

感知,就像我们靠眼睛看、耳朵听、身体感知周围环境一样,机器人手机的感知层就是AI的“五官和触觉”。它能通过手机的摄像头、传感器、麦克风,实时“看到”周围的环境、“听到”语音指令;同时还能联动智能手表、耳机等穿戴设备,同步“感知”用户的实时状态。

决策,如果说感知层是“收集信息的感官”,那决策层就是“处理信息、下达指令的大脑中枢”。机器人手机能依靠手机本地的端侧大模型,快速处理感知层收集到的所有信息:解析我们的真实意图,比如“帮我拍视频”不是简单打开相机,而是要调整角度跟拍,规划并完成任务的每一步,甚至能进行初步的情感判断,比如通过我们的语音语调和生理体征数据(如心率),判断出用户是开心、疲惫还是烦躁。

执行,决策层下达指令后,就需要执行层来“动手落实”,这就相当于AI的“手脚”了。机器人手机的机械臂云台能当“手”用,依托4DoF(四自由度)让“手”动起来,把指令转化为精准、流畅的动作,如旋转跟拍、点头回应、俯仰调整拍摄角度等。