通义千问开源320亿参数模型 已实现7款大语言模型全开源
今早我梦醒了坎
发表于 2024-4-7 17:04:47
184
0
0
通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。
基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。
Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。
多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
-
第7回博覧会の開幕当日、11月5日、ファイザーは革新薬のトルエンスルホン酸タラゾールパッリカプセル(商品名:テゼナ)が先日、国家薬監局(NMPA)の承認を得て発売されたと発表した。それはエンザルアミンと共同 ...
- 了看允侥
- 6 小时前
- 支持
- 反对
- 回复
- 收藏
-
何思文氏は、「進博会というプラットフォームでは、私たちが始めたのは耳を傾けるモデルであり、進博会を通じて各種製品を展示し、消費者の需要とフィードバックを集め、将来中国に輸入する製品を決定するのに役立 ...
- an7en
- 7 小时前
- 支持
- 反对
- 回复
- 收藏
-
【エイダ氏は元NASA宇宙センター主任を取締役会メンバーに任命】エイレンオチョア氏はNASAのベテラン、エレン・オチョア氏を取締役に任命し、取締役会の規模は13人に拡大した。英偉達氏は声明の中で、66歳のオチョ ...
- 柔柔树呆熊呆j
- 9 小时前
- 支持
- 反对
- 回复
- 收藏
-
ハイエンド機能性アパレルブランドのCanada Gooseカナダガチョウは、2024年9月29日現在の2025年度第2四半期決算を発表した。 「私たちが直面しているマクロ経済環境はますます厳しくなり、消費者感情が影響を受けて ...
- 薇唯玮味
- 1 小时前
- 支持
- 反对
- 回复
- 收藏