阿里云发布通义千问2.0 模型参数达千亿级
长安不良帅
发表于 2023-11-1 16:17:41
275
0
0
据介绍,过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆等能力上均有显著提升。
中英文理解能力是大语言模型的基本功。英语任务方面,通过大幅增加参数量,通义千问2.0能更好地理解和处理复杂的语言结构和概念;中文任务方面,通义千问2.0由于模型在训练中学习了更多中文语料,进一步强化了中文理解和表达能力。
在数学推理、代码理解等领域,通义千问2.0进步明显。在推理基准测试GSM8K中,通义千问展示了强大的计算和逻辑推理能力;在HumanEval测试中,通义千问得分紧跟GPT-4和GPT-3.5,该测试主要衡量大模型理解和执行代码片段的能力,这一能力是大模型应用于编程辅助、自动代码修复等场景的基础。
据介绍,通义千问2.0在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。
与此同时,基于通义大模型训练的8大行业模型组团上线,他们分别是通义灵码-智能编码助手、通义智文-AI阅读助手、通义听悟-工作学习AI助手、通义星尘-个性化角色创作平台、通义点金-智能投研助手、通义晓蜜-智能客服、通义仁心-个人专属健康助手、通义法睿-AI法律顾问。8大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。
据了解,截至10月底,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。
阿里云CTO周靖人透露,阿里云计划近期开源通义千问72B版本,此前,阿里云已先后开源7B和14B版本模型,模型累计下载量超过100万。阿里云将持续支持千行百业的开发者基于通义千问开源模型进行模型和应用创新。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
-
第7回博覧会の開幕当日、11月5日、ファイザーは革新薬のトルエンスルホン酸タラゾールパッリカプセル(商品名:テゼナ)が先日、国家薬監局(NMPA)の承認を得て発売されたと発表した。それはエンザルアミンと共同 ...
- 了看允侥
- 昨天 13:34
- 支持
- 反对
- 回复
- 收藏
-
何思文氏は、「進博会というプラットフォームでは、私たちが始めたのは耳を傾けるモデルであり、進博会を通じて各種製品を展示し、消費者の需要とフィードバックを集め、将来中国に輸入する製品を決定するのに役立 ...
- an7en
- 昨天 12:44
- 支持
- 反对
- 回复
- 收藏
-
【エイダ氏は元NASA宇宙センター主任を取締役会メンバーに任命】エイレンオチョア氏はNASAのベテラン、エレン・オチョア氏を取締役に任命し、取締役会の規模は13人に拡大した。英偉達氏は声明の中で、66歳のオチョ ...
- 柔柔树呆熊呆j
- 昨天 10:34
- 支持
- 反对
- 回复
- 收藏
-
ハイエンド機能性アパレルブランドのCanada Gooseカナダガチョウは、2024年9月29日現在の2025年度第2四半期決算を発表した。 「私たちが直面しているマクロ経済環境はますます厳しくなり、消費者感情が影響を受けて ...
- 薇唯玮味
- 昨天 18:16
- 支持
- 反对
- 回复
- 收藏