통의천문 첫 천억 매개변수 모델이 왔다

清风吹袭断发表于 2024-4-29 16:07:40

252 0 0

"알리 통의천문"위챗 공중번호 4월 28일 소식에 따르면 통의천문은 처음으로 천억급 매개 변수모델 Qwen1.5-110B를 내놓았다.소개에 따르면 Qwen1.5-110B의 기초능력은 Meta-Llama-3-70B에 필적할수 있으며 Qwen1.5시리즈에서 규모가 가장 큰 모델이며 이 계렬에서 처음으로 1000억명이 넘는 매개 변수를 가진 모델이다.
연구진에 따르면 MMLU, GSM8K, MATH, HumanEval 등 벤치마킹에서 Qwen1.5-110B 모델이 3자 중 가장 우수한 것으로 평가됐다.TheoremQA, ARC-C, MBPP 등의 평가에서 Qwen1.5-110B 모델은 Llama-3-70B보다 우수했다.

'알리퉁이 천문'위챗 대중번호

또한 Chat 모델에 대한 연구팀의 평가에 따르면 MT-Bench와 AlpacaEval 2.0에서 Qwen1.5-110B-Chat 모델의 성과를 비교했다.그 결과 Qwen1.5-72B-Chat 모델은 이전에 발표 된 Qwen1.5-110B-Chat 모델에 비해 분명히 더 나은 것으로 나타났습니다.

'알리퉁이 천문'위챗 대중번호

올해 들어 통의천문팀은 최신 오픈 소스 모델 시리즈인 Qwen1.5를 출시한 뒤 3개월도 안 돼 8개의 대언어 모델을 연속 선보였다. 그동안 모델 매개변수 규모는 5억, 18억, 40억, 70억, 140억, 320억, 720억을 포함했지만 이번 Qwen1.5-110B의 매개변수 규모는 1100억에 이른다.현재 통의천문 오픈 소스 모델은 700만 다운로드를 넘어선 것으로 알려졌다.

微信ビッグニュース！タオバオリンクを開いて直接ショッピングをサポート

マースク：テスラRobotaxiの車両コストは3万ドルを下回り、2年後に生産を開始する予定

FED議事録は冷水を浴びせるのか？アナリストは、FRB関係者は金利引き下げを急いでいないという共通認識に達した。

AMDが発表したインテルの競合品AIチップの予想市場規模は4年から5000億ドル