首页 > 计算机科学

谢赛宁、李飞飞「空间智能」新作:多模态大模型仍难突破空间推理

学术头条 2024-12-23 12:30
文章摘要
谢赛宁和李飞飞团队研究了多模态大语言模型(MLLMs)在空间推理方面的能力。研究发现,尽管MLLMs在视觉空间智能方面显示出一定的能力,但空间推理仍然是其性能提升的主要瓶颈。研究通过新的视觉空间智能基准(VSI-Bench)测试了MLLMs的空间推理能力,发现这些模型在处理复杂的空间关系和视角转换时表现不佳。研究还指出,现有的语言推理技术对提升空间推理能力帮助有限,未来需要开发更有效的空间记忆机制。
谢赛宁、李飞飞「空间智能」新作:多模态大模型仍难突破空间推理
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。
最新文章
谢赛宁、李飞飞「空间智能」新作:多模态大模型仍难突破空间推理
谢赛宁、李飞飞「空间智能」新作:多模态大模型仍难突破空间推理
人类拥有视觉空间智能,可以通过连续的视觉观察记忆空间。然而,在百万规模的视频数据集上训练的多模态大语言模型(MLLMs)也能从视频中进行“空间思维”吗?今日凌晨,纽约大学计算机科学助理教授谢赛宁团队联
12小时前
AI同时操控200个机器人,任务成功率超90%,半数故障依然「能打」
AI同时操控200个机器人,任务成功率超90%,半数故障依然「能打」
人工智能(AI),可以同时操控数百机器人“协同作战”了。来自康斯坦茨大学和国际理论物理中心的研究团队开发了一种基于 AI 的控制策略,成功让 200 个微型机器人变身为“AI 智能体”,独立作出决策,
2024-12-21
“Transformer八子”之一,让AI大模型学会了主动“忘记”
“Transformer八子”之一,让AI大模型学会了主动“忘记”
还记得第一个“人工智能科学家”(The AI Scientist)吗?只需 15 美元,它就可以写出一篇超过顶级机器学习会议接受门槛的论文。从生成新颖的研究想法、编写代码、执行实验、可视化结果,到通过
2024-12-20
刚刚,OpenAI元老级研究员Alec Radford离职,他主导了GPT-1、GPT-2的研发
刚刚,OpenAI元老级研究员Alec Radford离职,他主导了GPT-1、GPT-2的研发
内容来自:机器之心作者:杜伟、陈陈OpenAI 连续 12 天发布会还剩最后一天,期待中的「重磅」迟迟没来,反而失去了一位核心研究人员。OpenAI 人事方面的变动还在继续。今日,据外媒 The In
2024-12-20
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1