• 回到顶部
  • QQ客服
  • 微信二维码

OpenAI 发布两款开放权重 AI 推理模型,性能可与 o4-mini 相当

2025-08-06 11:16
浏览量:0
当地时间 8 月 5 日,OpenAI 宣布发布两款开放权重 AI 推理模型 ——GPT-oss-120b 和 GPT-oss-20b,这也是自 2019 年发布 GPT-2 以来,OpenAI 首次推出新的 “开源” 大语言模型。

当地时间 8 月 5 日,OpenAI 宣布发布两款开放权重 AI 推理模型 ——GPT-oss-120b 和 GPT-oss-20b,这也是自 2019 年发布 GPT-2 以来,OpenAI 首次推出新的 “开源” 大语言模型。

OpenAI 首席执行官山姆・奥特曼在社交媒体上表示:“GPT-oss 是一个重大突破,这是最先进的开放权重推理模型,具有与 o4-mini 相当的强大现实世界性能,可以在你自己的电脑(或手机的较小版本)上本地运行。”

据悉,参数达到 1170 亿的 GPT-oss-120b 功能更强,可由单个英伟达专业数据中心 GPU 驱动;参数为 210 亿的 GPT-oss-20b 模型,则能够在配备 16GB 内存的消费级笔记本电脑上运行。

OpenAI 表示,两款模型都采用了其最先进的预训练和后训练技术,特别注重推理、效率和跨部署环境的实用性。它们都是使用专家混合(MoE)架构的 Transformer,以减少处理输入所需的活跃参数数量。

GPT-oss-120b 每个 token 激活 5.1 亿参数,总参数量为 1170 亿;GPT-oss-20b 激活 36 亿参数,总参数量为 210 亿。模型使用交替的密集和局部带状稀疏注意力模式,支持高达 128k 的上下文长度。

OpenAI 称 GPT-oss-20b 是一款中型开放模型,GPT-oss-120b 则是可在 “大多数台式机和笔记本电脑” 上运行的大型开放模型。

在性能评估方面,OpenAI 披露,GPT-oss-120b 在核心推理基准测试中接近 OpenAI o4-mini 的表现。较小的 GPT-oss-20b 模型在相同评估中达到或超过 OpenAI o3-mini 的性能。

值得注意的是,相较 o3 和 o4-mini 模型,两款开放模型也会出现更多的幻觉。OpenAI 解释称,由于较小的模型拥有的世界知识比大型前沿模型少,所以更容易产生幻觉也在意料之中。在 OpenAI 内部用于衡量模型对人物知识准确性的 PersonQA 基准测试中,GPT-oss-120b 和 GPT-oss-20b 分别对 49% 和 53% 的问题产生幻觉,达到 o1 模型的 3 倍多,也高于 o4-mini 模型的 36%。

此外,这两款模型都以宽松的 Apache 2.0 许可证发布,企业在商用前无需付费或获得许可。

 

推荐话题

更多 >>
  • 盘点2025旅游行业:双循环激活新动能 体验升级定义新消费

    闪闻文旅12月12日消息 作为“十四五”规划收官的关键节点,2025年中国旅游行业完成了从“规模复苏”到“质量跃升”的深刻转型。文化和旅游部年末初步核算数据显示,全年国内旅游人次达65亿,旅游总收入突破7万亿元,分别较2024年增长12%和15%;入境游市场强势反弹,前三季度入境外国游客数量恢复至2019年同期的112%,国际业务增速领跑行业,“国内国际双循环”的旅游发展新格局正式形成。

    0 2025-12-12
  • 招商信诺被指设“保险陷阱”侵吞用户4.5万元, 报告期内某产品退保率达375%

    近日,本报记者收到一份举报信称,举报招商银行与招商信诺人寿保险有限公司(简称:招商信诺)涉嫌联合骗保,在个人信用卡账单中设下“保险陷阱”。“2022年因逾期核查账单时,发现有6笔“保险费”在他不知情、未授权的情况下被扣除,累计金额达44510.69元。”

    5 2025-12-11
  • 2025中国金融行业全景:财富管理提质 实体支撑强化

    2025年作为“十四五”规划收官之年,中国金融行业以“服务实体为根、风险防控为盾、改革创新为翼”,实现高质量发展的关键突破。全年人民币贷款新增超18万亿元,普惠小微贷款余额突破36万亿元,财富管理市场规模稳步扩容至160万亿元,在政策精准引导与行业自律升级的双重驱动下,金融与实体经济的共生共荣格局愈发清晰。

    4 2025-12-10

热门排行

更多 >>