首页 报纸 正文

現地時間6月14日、英偉達オープンソースNemotron-4340 B(3400億パラメータ)シリーズモデル。英偉達氏によると、開発者はこの一連のモデルを用いて合成データを生成し、医療保健、金融、製造、小売、その他の業界のビジネス応用のための大型言語モデル(LLM)を訓練することができる。
Nemotron-4340 Bは、ベースモデルBase、命令モデルInstruct、奨励モデルRewardを含む。英偉達は9兆個のtoken(テキスト単位)を使って訓練を行った。Nemotron-4340 B-Baseは、ARC-c、MMLU、BBHベンチマークテストなどの常識的な推論タスクにおいて、Llama-370 B、Mixtral 8 x 22 B、Qwen-272 Bモデルに匹敵することができる。
标签: Initial
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

四轮day 新手上路
  • 粉丝

    0

  • 关注

    0

  • 主题

    1