找回密码
 立即注册
搜索
热搜: Apple Tesla Amazon
查看: 4343|回复: 0

通義千問初の千億パラメータモデルが来た

[复制链接]

0

主题

0

回帖

0

积分

新手上路

积分
0
发表于 2024-4-29 16:07:39 | 显示全部楼层 |阅读模式

「アリ通義千問」ウィーチャット公式アカウント4月28日によると、通義千問は初めて千億級パラメータモデルQwen 1.5-110 Bを発売した。紹介によると、Qwen 1.5-110 Bの基礎能力はMeta-Lama-3-70 Bに匹敵し、Qwen 1.5シリーズの中で最大規模のモデルであり、同シリーズの中で初めて1000億を超えるパラメータを持つモデルでもある。
研究チームの評価によると、MMLU、GSM 8 K、MATH、HumanEvalなどのベンチマークテストでは、Qwen 1.5-110 Bモデルが3つの中で最も優れていることが分かった。TheoremQA、ARC-C、MBPPなどの評価では、Qwen 1.5-110 BモデルはLlama-3-70 Bより優れている。
「アリ通義千問」ウィーチャット公式アカウント

また、研究チームがChatモデルを評価したところ、MT-BenchとAlpacaEval 2.0におけるQwen 1.5-110 B-Chatモデルの表現を比較した。その結果、Qwen 1.5-110 B-Chatモデルは、先に発表されたQwem 1.5-72 B-Chatモデルよりも明らかに優れていることが明らかになった。
「アリ通義千問」ウィーチャット公式アカウント

今年に入ってから、通義千問チームは最新のオープンソースモデルシリーズQwen 1.5を発売し、その後3ヶ月足らずで8種類の大言語モデルを連続的に発売した。これまでのモデルパラメータ規模は5億、18億、40億、70億、140億、320億、720億だったが、今回のQwen 1.5-110 Bのパラメータ規模は1100億に達した。現在、通義千問のオープンソースモデルのダウンロード数は700万を超えているという。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|www.LogoMoeny.com

GMT+8, 2024-11-30 14:44 , Processed in 0.136033 second(s), 8 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表