谢赛宁、李飞飞「空间智能」新作：多模态大模型仍难突破空间推理

学术头条 2024-12-23 12:30

文章摘要

谢赛宁和李飞飞团队研究了多模态大语言模型（MLLMs）在空间推理方面的能力。研究发现，尽管MLLMs在视觉空间智能方面显示出一定的能力，但空间推理仍然是其性能提升的主要瓶颈。研究通过新的视觉空间智能基准（VSI-Bench）测试了MLLMs的空间推理能力，发现这些模型在处理复杂的空间关系和视角转换时表现不佳。研究还指出，现有的语言推理技术对提升空间推理能力帮助有限，未来需要开发更有效的空间记忆机制。

阅读全文

本站注明稿件来源为其他媒体的文/图等稿件均为转载稿，本站转载出于非商业性的教育和科研之目的，并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题，请作者速来电或来函联系。

最新文章

谢赛宁、李飞飞「空间智能」新作：多模态大模型仍难突破空间推理

人类拥有视觉空间智能，可以通过连续的视觉观察记忆空间。然而，在百万规模的视频数据集上训练的多模态大语言模型（MLLMs）也能从视频中进行“空间思维”吗？今日凌晨，纽约大学计算机科学助理教授谢赛宁团队联

12小时前

AI同时操控200个机器人，任务成功率超90%，半数故障依然「能打」

人工智能（AI），可以同时操控数百机器人“协同作战”了。来自康斯坦茨大学和国际理论物理中心的研究团队开发了一种基于 AI 的控制策略，成功让 200 个微型机器人变身为“AI 智能体”，独立作出决策，

2024-12-21

“Transformer八子”之一，让AI大模型学会了主动“忘记”

还记得第一个“人工智能科学家”（The AI Scientist）吗？只需 15 美元，它就可以写出一篇超过顶级机器学习会议接受门槛的论文。从生成新颖的研究想法、编写代码、执行实验、可视化结果，到通过

2024-12-20

刚刚，OpenAI元老级研究员Alec Radford离职，他主导了GPT-1、GPT-2的研发

内容来自：机器之心作者：杜伟、陈陈OpenAI 连续 12 天发布会还剩最后一天，期待中的「重磅」迟迟没来，反而失去了一位核心研究人员。OpenAI 人事方面的变动还在继续。今日，据外媒 The In

2024-12-20