3B 超越 7B,Mistral AI 推出端侧模型 Ministral 3B 和 8B

学术头条 2024-10-17 12:02
文章摘要
Mistral AI 推出了最新一代端侧模型 Ministral 3B 和 Ministral 8B,这两款模型专为端侧计算和边缘用例设计,具有高效率和低延迟的特点。Ministral 8B 采用了特殊的交错滑动窗口注意力机制(SWA),显著提升了推理速度和内存效率。这些模型支持高达 128k 的上下文长度,适用于端侧翻译、无互联网智能助手、本地分析和自主机器人等应用场景。Mistral AI 强调,Ministral 3B 在大多数基准测试中已经超越了 Mistral 7B,展示了其在性能上的优越性。
3B 超越 7B,Mistral AI 推出端侧模型 Ministral 3B 和 8B
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。
最新文章
132年未解开的李雅普诺夫函数谜题,被Symbolic Transformer攻克了
132年未解开的李雅普诺夫函数谜题,被Symbolic Transformer攻克了
内容来自:机器之心编辑:蛋酱、佳琪牛顿没解决的问题,AI给你解决了?AI的推理能力一直是研究的焦点。作为最纯粹、要求最高的推理形式之一,能否解决高级的数学问题,无疑是衡量语言模型推理水平的一把尺。虽然
20小时前
Meta被斥:他们污染了“开源”一词;李开复:零一万物绝不放弃预训练模型|一周热门
Meta被斥:他们污染了“开源”一词;李开复:零一万物绝不放弃预训练模型|一周热门
大模型周报将从【企业动态】【技术前瞻】【政策法规】【专家观点】四部分,带你快速跟进大模型行业热门动态。企业动态“世界首例”交易!谷歌将为人工智能数据中心购买核电谷歌签署了一项“世界首例 ”协议,将从一
2024-10-19
Meta提出思维偏好优化TPO;谷歌推出可穿戴基础模型LSM|大模型论文日报
Meta提出思维偏好优化TPO;谷歌推出可穿戴基础模型LSM|大模型论文日报
今日值得关注的大模型前沿论文Meta 提出思维偏好优化 TPO谷歌推出可穿戴基础模型 LSMMeta 推出媒体生成基础模型 Movie Gen康奈尔大学团队:从交互中回溯学习AgentOccam:基于
2024-10-18
“AI调解员”登上Science!Google DeepMind打造,“劝架”水平远超人类
“AI调解员”登上Science!Google DeepMind打造,“劝架”水平远超人类
要集体行动,群体必须达成一致意见;然而,当各方参与者提出截然不同但有效的观点时,这可能具有挑战性。如今,来自 Google DeepMind 的一项研究,为帮助群体在实际辩论中达成共识,提供了一个行之
2024-10-18
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1