推广 热搜：全国客服热线全国统一服务热线 24小时服务热线附近服务网点全国报修全国报修网点 24小时服务电话家电上门服务附近上门服务网点故障原因分析及处理

最新研究：嵌入大模型的AI扫地机器人多项任务翻车，成功率仅40%头条热点

更新时间: 2025-11-03 06:11 发布时间: 7小时前 980

核心提示：　　AI实验室Andon Labs最近进行的一项评估显示，搭载顶级大模型的扫地机器人在简单家务任务中表现糟糕，成功率远低于人类。实验要求机器人执行“把黄油递给人”的多步骤指令，包括跨房间定位、区分包装、寻找移动位置的人类、完成交付并返回充电。结果显示，Gemini 2.5 Pro 的成功率仅 40%

　　AI实验室Andon Labs最近进行的一项评估显示，搭载顶级大模型的扫地机器人在简单家务任务中表现糟糕，成功率远低于人类。实验要求机器人执行“把黄油递给人”的多步骤指令，包括跨房间定位、区分包装、寻找移动位置的人类、完成交付并返回充电。结果显示，Gemini 2.5 Pro 的成功率仅 40%，Claude Opus 4.1 为 37%，GPT-5 为 30%，明显落后于人类的表现。

　　研究指出，大模型在空间推理、环境理解、长期任务规划等方面依然存在明显短板。

　　研究团队强调，娱乐之外也有严肃隐患：某些机器人可被诱导泄露机密文件，部分机型无法识别楼梯风险而从高处跌落，暴露当前大型语言模型（LLM）与机器结合的安全漏洞。

　　在资本大举押注机器人时代的当下，这项研究提醒人们：强大的文本生成能力不代表能稳定、安全地在物理世界执行任务，AI机器人距离真正进入家庭仍有大量工程与安全问题需要解决。

点赞 0反对 0举报 0 收藏 0 打赏 0评论 0

更多>同类资讯频道

推荐图文

推荐资讯频道

点击排行

• 沈阳博世中央空调24小时售后服务中心-总部授权	• 港华紫荆壁挂炉售后服务24小时400客户报修电话-
• 深圳奥普集成灶总部售后电话24小时_快速联系售	• 曼亚指纹锁常见问题处理全国2025排名一览
• MI中央空调维修服务热线24小时热线全国《今日发	• 三菱空调自清洁原理，三菱空调自清洁原理视频讲
• 维修冰箱视频教程全集，维修冰箱的电话号码是多	• 米勒燃气灶维修解决办法全国2025排名一览
• 古德曼空调维修热线号码查询 - 维修服务网点地	• 湿曼空调维修服务中心-24小时全国报修400热线实