首页 신문 正文

"알리 통의천문"위챗 공중번호 4월 28일 소식에 따르면 통의천문은 처음으로 천억급 매개 변수모델 Qwen1.5-110B를 내놓았다.소개에 따르면 Qwen1.5-110B의 기초능력은 Meta-Llama-3-70B에 필적할수 있으며 Qwen1.5시리즈에서 규모가 가장 큰 모델이며 이 계렬에서 처음으로 1000억명이 넘는 매개 변수를 가진 모델이다.
연구진에 따르면 MMLU, GSM8K, MATH, HumanEval 등 벤치마킹에서 Qwen1.5-110B 모델이 3자 중 가장 우수한 것으로 평가됐다.TheoremQA, ARC-C, MBPP 등의 평가에서 Qwen1.5-110B 모델은 Llama-3-70B보다 우수했다.
'알리퉁이 천문'위챗 대중번호

또한 Chat 모델에 대한 연구팀의 평가에 따르면 MT-Bench와 AlpacaEval 2.0에서 Qwen1.5-110B-Chat 모델의 성과를 비교했다.그 결과 Qwen1.5-72B-Chat 모델은 이전에 발표 된 Qwen1.5-110B-Chat 모델에 비해 분명히 더 나은 것으로 나타났습니다.
'알리퉁이 천문'위챗 대중번호

올해 들어 통의천문팀은 최신 오픈 소스 모델 시리즈인 Qwen1.5를 출시한 뒤 3개월도 안 돼 8개의 대언어 모델을 연속 선보였다. 그동안 모델 매개변수 규모는 5억, 18억, 40억, 70억, 140억, 320억, 720억을 포함했지만 이번 Qwen1.5-110B의 매개변수 규모는 1100억에 이른다.현재 통의천문 오픈 소스 모델은 700만 다운로드를 넘어선 것으로 알려졌다.
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

清风吹袭断 注册会员
  • 粉丝

    0

  • 关注

    0

  • 主题

    43