品玩8月6日讯,据OpenAI 官方消息,OpenAI 今日正式推出 gpt-oss-120b 和 gpt-oss-20b 两款开放权重语言模型,以 Apache 2.0 许可证开源,首次实现开源模型在推理能力、工具使用和硬件适配性上的全面突破。
作为自 2019 年 GPT-2 以来的首款开源模型,gpt-oss-120b(1170 亿参数)在核心推理基准测试中性能接近 OpenAI o4-mini,可在单块 80GB GPU 上高效运行;gpt-oss-20b(210 亿参数)则以 16GB 内存支持边缘设备部署,在常见任务中媲美 o3-mini。两者均采用混合专家(MoE)架构,每 token 仅激活 51 亿和 36 亿参数,通过分组多查询注意力(GQA)和旋转位置编码(RoPE)技术,原生支持 128k 上下文长度,显著降低推理成本。
在工具调用评测中,两款模型在 TauBench 和 HealthBench 上表现超越 OpenAI o1 和 GPT-4o 等专有模型,尤其在医疗问答场景中准确率提升 23%。安全方面,OpenAI 通过对抗性微调测试和外部专家审核,确保模型在生物安全、网络安全等敏感领域的风险可控,其内部安全基准表现与前沿闭源模型持平。
首批合作伙伴 AI Sweden、Orange 和 Snowflake 已开始探索本地化部署:AI Sweden 将模型用于工业数据分析,Orange 计划集成至通信网络优化,Snowflake 则聚焦企业数据隐私保护场景snowflake.com。这一战略举措被业界视为应对 Meta、Mistral 等竞争对手开源攻势的关键布局,标志着 OpenAI 从封闭生态向开放创新的重大转型。
开发者可通过 Hugging Face 下载模型,或结合 Responses API 实现从本地推理到云端部署的灵活选择。OpenAI 表示,此举旨在 “让每个人都能在自有基础设施上运行和定制 AI”,推动生成式技术进入普惠时代。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3561739510@qq.com 举报,一经查实,本站将立刻删除。!
本文链接:https://www.huorao.com/article-13316-1.html