当前位置：首页 > 游戏简评 > 正文

小米开源声音理解大模型

游客
游戏简评
2025-08-09
2

品玩8月5日讯，据小米科技官方消息，小米正式发布并全量开源其声音理解大模型 MiDashengLM-7B 模型。

官方介绍，MiDashengLM-7B 基于 Xiaomi Dasheng 作为音频编码器和 Qwen2.5-Omni-7B Thinker 作为自回归解码器，通过创新的通用音频描述训练策略，实现了对语音、环境声音和音乐的统一理解。

值得一提的是，MiDashengLM-7B 的声音理解性能在 22 个公开评测集上刷新多模态大模型最好成绩（SOTA），多个基准测试超越 Qwen2.5-Omni 7B 和 Kimi-Audio-Instruct 7B。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 3561739510@qq.com 举报，一经查实，本站将立刻删除。！
本文链接：https://www.huorao.com/article-13314-1.html

上一篇
绝地求生DX版本选择1060显卡时应注意什么？

下一篇
鸿蒙版《金铲铲之战》于8月5日正式开启万人删档测试

最新文章

拓展互动娱乐边界，闪迪携全系列存储方案亮相ChinaJoy 2025
2025-08-09
腾讯混元推出 AI 播客功能，适用 ima、腾讯新闻等应用
2025-08-09
OpenAI或正就股份出售事宜进行谈判，估值高达5000亿美元
2025-08-09
紧盯AI人才，“鹅厂”招新，软件开发、技术研究需求量大！
2025-08-09
中国少儿科普计划：孩子们爱去的地方，都有斑马的「知识惊喜」
2025-08-09
OpenAI 发布全球首款千亿级开放权重模型
2025-08-09
鸿蒙版《金铲铲之战》于8月5日正式开启万人删档测试
2025-08-09
小米开源声音理解大模型
2025-08-09