首页 > 计算机科学

放弃agent,图灵奖得主Yoshua Bengio提出Scientist AI:避免人类生存威胁

学术头条 2025-02-25 12:06
文章摘要
本文探讨了人工智能(AI)系统可能带来的失控风险,特别是基于强化学习和模仿学习的智能体(agent)可能存在的目标偏差、目标泛化和奖励篡改等问题。为了预防这些风险,图灵奖得主Yoshua Bengio提出了一种非智能体AI系统——Scientist AI。Scientist AI通过理解世界而非直接行动来提供帮助,其设计包括一个世界模型和一个问答推理机器,旨在通过非智能设计降低风险,同时保持高效的科学研究和推理能力。Scientist AI的应用场景包括加速科学发现、作为其他AI系统的安全护栏以及研究如何安全地开发超级智能体。其核心价值在于将复杂系统的解释权交还人类,确保人类始终掌控最终决策权。
放弃agent,图灵奖得主Yoshua Bengio提出Scientist AI:避免人类生存威胁
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。
最新文章
放弃agent,图灵奖得主Yoshua Bengio提出Scientist AI:避免人类生存威胁
放弃agent,图灵奖得主Yoshua Bengio提出Scientist AI:避免人类生存威胁
人工智能(AI)系统或将逃脱人类控制,欺骗人类,甚至给全人类带来灾难性的后果。越来越多的人开始担心,随着通用人工智能(AGI)和超级智能(ASI)的发展,以往科幻电影中才会出现的场景逐渐演变成现实的风
16小时前
今日Nature:AI游戏设计师问世,自学成才,无需任何先前知识
今日Nature:AI游戏设计师问世,自学成才,无需任何先前知识
在当今数字化时代,创意产业正经历着一场由生成式人工智能(AI)引发的变革。从文本、图像到音频、视频,AI 正以前所未有的速度和规模生成各种内容,为创意工作者提供了全新的工具和思路。然而,将这些技术无缝
2025-02-19
刚刚,「诺奖风向标」2025年斯隆奖出炉:28位华人学者获奖
刚刚,「诺奖风向标」2025年斯隆奖出炉:28位华人学者获奖
今天,斯隆基金会公布了 2025 年度斯隆研究奖获得者名单。斯隆研究奖被誉为诺奖风向标之一,自 1955 年以来,每年颁发一次,以向这些“早期职业科学家和学者提供支持和认可”。截止 2025 年 2
2025-02-19
刚刚,马斯克发布 Grok3,推理能力远超 o3 mini(high) 和 DeepSeek-R1
刚刚,马斯克发布 Grok3,推理能力远超 o3 mini(high) 和 DeepSeek-R1
在试图以 974 亿美元收购 OpenAI 的提议被拒绝后,世界首富马斯克又搞了一个大动作——刚刚,他发布了号称“地球最聪明的 AI”,Grok3,其由一个包含约 20 万个 GPU 的数据中心训练,
2025-02-18
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1