首页 > 计算机科学

Meta提出“可持续思维链”,让大模型在连续潜空间中推理|大模型日报

学术头条 2024-12-13 08:23
文章摘要
Meta提出“可持续思维链”(Coconut),旨在让大语言模型在连续潜空间中进行推理,以提高推理效率和能力。北大团队提出了“自定义漫画生成”框架DiffSensei,通过集成扩散图像生成器和多模态大语言模型,实现了对多角色漫画生成的精确控制。苹果团队则提出了一种可扩展的视频生成方法STIV,利用扩散Transformer进行视频运动迁移,展示了在视频生成领域的显著进步。这些研究展示了在不同领域中大模型技术的创新应用,推动了图像生成、视频生成和语言模型推理的发展。
Meta提出“可持续思维链”,让大模型在连续潜空间中推理|大模型日报
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。
最新文章
Meta提出“可持续思维链”,让大模型在连续潜空间中推理|大模型日报
Meta提出“可持续思维链”,让大模型在连续潜空间中推理|大模型日报
今日值得关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal:通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动
12小时前
2024 ACL Fellow 名单出炉:高剑峰、张民等四位华人入选
2024 ACL Fellow 名单出炉:高剑峰、张民等四位华人入选
今天,ACL(国际计算语言学协会)公布了最新的 2024 ACL Fellow 名单。值得一提的是,在所有 9 人入选名单中,有 4 位华人学者。分别是:Scott Wen-tau Yih,FAIR
2024-12-12
OpenAI深夜被狙击!谷歌发布新一代大模型Gemini 2.0,AlphaGo之父:迈向智能体时代
OpenAI深夜被狙击!谷歌发布新一代大模型Gemini 2.0,AlphaGo之父:迈向智能体时代
在连续 12 天开放日的第 5 天,OpenAI 被谷歌深夜大招狙击了。今日凌晨,谷歌正式发布了 Gemini 2.0 系列人工智能(AI)模型的首个版本——Gemini 2.0 Flash,该模型代
2024-12-12
AI用北京话念绕口令!清华、智谱团队打造GLM-4-Voice,更智能、懂情绪,已开源
AI用北京话念绕口令!清华、智谱团队打造GLM-4-Voice,更智能、懂情绪,已开源
今年 10 月,智谱在 CNCC2024 大会上推出了他们在多模态领域的最新成果——端到端情感语音模型 GLM-4-Voice,让人和机器的交流能够以自然聊天的状态进行。以下为他们在官方 GitHub
2024-12-11
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1