NSR综述：多模态大语言模型

知社学术圈 2024-12-13 11:30

文章摘要

近年来，大语言模型（LLM）在自然语言处理领域取得了显著进展，但其局限性在于只能处理文本输入输出。为解决这一问题，多模态大语言模型（MLLM）应运而生，它结合了多模态信息处理能力，能够处理图像、声音等多种形式的信息。MLLM具有模型大、新的训练范式等特点，展现出如数学推理、故事创作等新能力。本文综述了MLLM的基础构成、训练策略、数据与评估，并讨论了多模态幻觉、上下文学习等研究主题，为相关研究提供了指南。

阅读全文

本站注明稿件来源为其他媒体的文/图等稿件均为转载稿，本站转载出于非商业性的教育和科研之目的，并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题，请作者速来电或来函联系。

最新文章

河北农业大学，首篇Science！

达尔文的“恼人之谜”——被子植物为何能在地球上迅速崛起、并在极短时间内完成爆发式多样化，是多年悬而未决的科学难题。赵建军团队联合国内外多家科研机构，以堪称“作物界快速进化的范例”白菜为研究对象，从基因

22小时前

上海交大中英国际低碳学院姚琳课题组与波兰West Pomeranian University of Technology in Szczecin陈学成教授联合诚聘博士后

上海交通大学中英国际低碳学院姚琳副教授课题组与波兰West Pomeranian University of Technology in Szczecin的陈学成教授因科研和团队发展需要，现面向海内外

22小时前

北京大学科维理天文与天体物理研究所邵立晶研究团队：提出处理黑洞铃宕（ringdown）信号的贝叶斯分析新框架

北京大学科维理天文与天体物理研究所邵立晶研究团队提出处理黑洞铃宕（ringdown）信号的贝叶斯分析新框架，并构建了可应用于实际引力波数据的“FIREFLY”开源算法。FIREFLY基于贝叶斯定理和重

2026-02-07

$孔令茹课题组:MnFe\u2082O\u2084/Bi\u2082WO\u2086复合材料通过氧空位工程和S型异质结构建实现光催化还原二氧化碳的协同改进$

孔令茹课题组:MnFe\u2082O\u2084/Bi\u2082WO\u2086复合材料通过氧空位工程和S型异质结构建实现光催化还原二氧化碳的协同改进

背景介绍利用太阳能对有价值的烃类燃料中的二氧化碳（CO2）进行光催化还原，为解决全球能源危机以及因过量二氧化碳排放而引发的环境问题提供了一种极具前景的解决方案。然而，该技术的实用应用仍受到若干关键挑战

2026-02-07