首页 > 计算机科学

清华团队「超级对齐」新研究:如何定义?怎样实现?

学术头条 2024-12-18 18:13
文章摘要
清华大学和电子科技大学的研究团队提出了一种新的“超级对齐”概念,旨在解决超人类智能系统在复杂任务中的安全与可靠性问题。研究团队定义“超级对齐”为在人类专家标注任务复杂且模型智能超过人类时,设计有效且高效的对齐算法。文章讨论了超级对齐的三大关键研究问题:弱到强的泛化、可扩展监督和对齐评价,并提出了一个由攻击者、学习者和批评者组成的系统化框架来实现对齐优化。未来研究将关注高风险领域的新兴隐患,并致力于构建更可靠且可扩展的监督机制,以实现人类与人工智能的高效协作。
清华团队「超级对齐」新研究:如何定义?怎样实现?
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。
最新文章
前微软首席人工智能技术官:2024 年 AI 的 7 大重要时刻
前微软首席人工智能技术官:2024 年 AI 的 7 大重要时刻
日前,前微软首席人工智能技术官、美国国家科学基金会人工智能顾问 Sophia Velastegui 在《福布斯》发文,对 2024 年人工智能最重要的趋势进行了总结,并预测了人工智能的未来。她在文中写
16小时前
清华团队「超级对齐」新研究:如何定义?怎样实现?
清华团队「超级对齐」新研究:如何定义?怎样实现?
超级智能(Superintelligence)是人工智能(AI)发展的更高维方向,具备远超人类的认知和能力,其潜在应用令人期待,但也将带来前所未有的治理与安全挑战。哲学家 Nick Bostrom 在
16小时前
再度狙击OpenAI!“谷歌版”Sora深夜上线,4k视频生成时代来了
再度狙击OpenAI!“谷歌版”Sora深夜上线,4k视频生成时代来了
今日凌晨,谷歌在此狙击 OpenAI——宣布推出全新视频生成模型 Veo 2 和最新版本的图像生成模型 Imagen 3,称两款模型在视频与图像生成上达到了 SOTA,能够为用户带来更高质量、更细致的
2024-12-17
把AI视为人?错了!DeepMind研究科学家:“模型即计算机”才是未来新范式
把AI视为人?错了!DeepMind研究科学家:“模型即计算机”才是未来新范式
图|Will Whitney,Google DeepMind 研究科学家,研究方向为可学习物理世界的模型。【编者按】人类科学家、企业家一直在按照人类的思考方式训练人工智能(AI)系统,希望机器可以像人
2024-12-17
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1