OpenAI 发布两款开放权重 AI 推理模型,性能可与 o4-mini 相当
当地时间 8 月 5 日,OpenAI 宣布发布两款开放权重 AI 推理模型 ——GPT-oss-120b 和 GPT-oss-20b,这也是自 2019 年发布 GPT-2 以来,OpenAI 首次推出新的 “开源” 大语言模型。
OpenAI 首席执行官山姆・奥特曼在社交媒体上表示:“GPT-oss 是一个重大突破,这是最先进的开放权重推理模型,具有与 o4-mini 相当的强大现实世界性能,可以在你自己的电脑(或手机的较小版本)上本地运行。”
据悉,参数达到 1170 亿的 GPT-oss-120b 功能更强,可由单个英伟达专业数据中心 GPU 驱动;参数为 210 亿的 GPT-oss-20b 模型,则能够在配备 16GB 内存的消费级笔记本电脑上运行。
OpenAI 表示,两款模型都采用了其最先进的预训练和后训练技术,特别注重推理、效率和跨部署环境的实用性。它们都是使用专家混合(MoE)架构的 Transformer,以减少处理输入所需的活跃参数数量。
GPT-oss-120b 每个 token 激活 5.1 亿参数,总参数量为 1170 亿;GPT-oss-20b 激活 36 亿参数,总参数量为 210 亿。模型使用交替的密集和局部带状稀疏注意力模式,支持高达 128k 的上下文长度。
OpenAI 称 GPT-oss-20b 是一款中型开放模型,GPT-oss-120b 则是可在 “大多数台式机和笔记本电脑” 上运行的大型开放模型。
在性能评估方面,OpenAI 披露,GPT-oss-120b 在核心推理基准测试中接近 OpenAI o4-mini 的表现。较小的 GPT-oss-20b 模型在相同评估中达到或超过 OpenAI o3-mini 的性能。
值得注意的是,相较 o3 和 o4-mini 模型,两款开放模型也会出现更多的幻觉。OpenAI 解释称,由于较小的模型拥有的世界知识比大型前沿模型少,所以更容易产生幻觉也在意料之中。在 OpenAI 内部用于衡量模型对人物知识准确性的 PersonQA 基准测试中,GPT-oss-120b 和 GPT-oss-20b 分别对 49% 和 53% 的问题产生幻觉,达到 o1 模型的 3 倍多,也高于 o4-mini 模型的 36%。
此外,这两款模型都以宽松的 Apache 2.0 许可证发布,企业在商用前无需付费或获得许可。
-
Seedance 2.0引爆AI视频革命 字节跳动重塑内容创作工业化新范式
2026年2月,字节跳动旗下即梦AI平台正式推出新一代多模态视频生成模型Seedance 2.0,这款被业内誉为“王炸级”的产品横空出世,以底层架构革新打破传统AI视频创作瓶颈,彻底改写内容生产逻辑,标志着AI视频生成正式从技术演示阶段迈入工业化实用新纪元,一场席卷全行业的AI视频革命全面引爆。
넶0 2026-02-14 -
反向春节成2026春运新主流 银发族进城团圆,年味解锁新方式
距离2026年丙午马年春节一周时间,2026年春运已进入出行高峰。与以往“大包小包返乡忙”的单向客流格局不同,今年“反向春节”热潮持续升温,越来越多年轻人选择接父母、长辈进城过年,银发族反向奔赴子女城市,成为春运市场最鲜明的新亮点,团圆形式虽变,亲情温度未减。
넶19 2026-02-09 -
河北大厂一公司被指高息放贷偷逃税款,监管部门问举报人能否和解
多年来,不断有举报人向各级金融监管及税务部门举报大厂回族自治县同安小额贷款有限公司(以下简称“同安公司”)及实控人郭某某高息放贷、收取砍头息、偷逃巨额税款、个人借用小贷公司通道放贷等违规违法行为,监管部门工作人员跟举报人协商是否“可和解”。举报人不同意和解后,监管部门给出的书面回复则称上述反映的问题不属实。
넶17 2026-02-09
- 2026-02-14
- 2026-02-09
- 2026-02-09
- 2026-02-08
- 2026-02-07
- 2026-02-06
- 2026-02-06
- 2026-02-05
