型直接装在这些设备上,不用依赖云端,设备自己就能处理数据、完成任务。比如你的手机里装了大模型,不用联网,就能帮你写文案、翻译、整理照片;你的智能手表里装了大模型,能实时分析你的健康数据,给出运动建议。
第一个优势:个性化。云端大模型是“服务所有人”的,没法精准适配每个人的习惯;而终端侧大模型就像“专属管家”,天天跟你打交道,越用越懂你。比如你的手机大模型,知道你喜欢看科技新闻,会优先给你推荐相关内容;知道你不喜欢冗长的文案,会把复杂的报告提炼成简短摘要;甚至知道你的说话语气,帮你发消息时能模仿你的风格,不会显得生硬。高通和中国电信合作的“麦芒”ai手机,就是终端侧大模型的典型例子,它的ai通话助手、ai修图功能,都是基于终端侧大模型,能精准适配用户的使用习惯 。
第二个优势:数据本地化处理,安全又高效。现在很多人担心“用ai会泄露隐私”——比如你把聊天记录、健康数据、工作文件传给云端,万一服务器被攻击,数据就可能泄露。但终端侧大模型根本不用传数据到云端,所有数据都存在你自己的设备上,只有你能访问,安全性大大提高。比如你用终端侧大模型处理工作合同,合同内容不会离开你的电脑;用它分析健康数据,心率、血压等信息只存在你的手表里,不用担心被第三方获取。而且不用联网传输数据,响应速度也更快——比如你让手机大模型整理照片,秒级就能完成,不用等云端处理完再传回来。
现在终端侧大模型已经开始落地:除了ai手机,还有ai眼镜——高通和中国电信合作的天翼ai眼镜,能智能识物、分析食物成分、讲解展品,这些功能都是终端侧大模型实现的,不用依赖云端,随时随地能用 ;还有智能家居,比如你的冰箱里装了大模型,能识别里面的食材,推荐菜谱,还能提醒你食材快过期了,全程不用联网,既方便又安全。
五、自变量机器人王浅:具身智能,ai理解物理世界的“新地基”
前面聊的agent、大模型,大多是在“数字世界”里干活——处理文字、数据、文件;而自变量机器人的王浅,把目光投向了“物理世界”,他提出:具身智能模型是平行于语言模型的“物理世界基础模型”,简单说就是让ai“走进现实,动手干活”。
先区分两个概念:语言模型(比如gpt、通义千问)是“理解数字世界的”,它能读懂文字、分析数据、生成内容,但它不知道“杯子掉在地上会碎”“搬东西要用力”这些物理规律;而具身智能模型是“理解物理世界的”,它能像人一样感知环境、学习物理规律,还能动手执行操作——比如机器人用具身智能模型,能拿起杯子、打开抽屉、走路不摔倒;自动驾驶汽车用具身智能模型,能判断路况、躲避障碍物、平稳转弯。
王浅说,具身智能模型就像ai的“物理课老师”,让ai从“只会纸上谈兵”变成“能动手实践”。比如以前的机器人,只能按照预设的程序干活,一旦环境变了就会出错——比如预设好拿杯子的力度,要是杯子是易碎的,就可能被捏碎;但具身智能模型能通过学习,理解“不同杯子的材质不同,需要用不同的力度拿”,就算遇到没见过的杯子,也能根据物理规律判断该怎么操作。
现在已经有很多具身智能的研发成果,比如北京团队开源的wow世界模型,能让ai“想象物理世界、预测结果、执行动作”——比如你让它“把杯子放到桌子上”,它能先在脑子里模拟“怎么伸手、怎么抓杯子、怎么放才平稳”,然后再让机器人实际操作,成功率很高。还有工业机器人,用具身智能模型能精准处理复杂的装配任务,比如给汽车零件上螺丝,能根据零件的位置调整力度和角度,不用人工干预;家庭服务机器人,能自己开门、拖地、整理物品,还能避开障碍物,不会撞到家具或人。
王浅强调,具身智能不是“替代语言模型”,而是和语言模型并行的“另一块地基”——语言模型负责处理“数字信息”,具身智能模型负责处理“物理信息”,两者结合,才能让ai真正融入我们的生活和工作。比如一个智能助手,既能用语言模型帮你处理工作邮件、写报告,又能用具身智能模型帮你整理办公桌、递文件;一个工业ai系统,既能用语言模型分析生产数据、优化流程,又能用具身智能模型控制机器人完成生产操作。
未来,具身智能会渗透到很多领域:制造业的工业机器人、医疗行业的手术机器人、家庭里的服务机器人、自动驾驶汽车、甚至是太空探索机器人,都会依赖具身智能模型,让ai从“数字世界”走进“物理世界”,真正成为能“动手干活”的帮手。
六、ppio姚星:agent基础设施,ai时代的“操作系统”
如果说agent是ai时代的“应用程序”,那ppio的姚星认为,agent的基础设施就是ai时代的“操作系统”——就像dows、ios连接电脑、手机的硬件和软件一样,agent基础设施连