現地時間6月14日、英偉達オープンソースNemotron-4340 B(3400億パラメータ)シリーズモデル。英偉達氏によると、開発者はこの一連のモデルを用いて合成データを生成し、医療保健、金融、製造、小売、その他の業界のビジネス応用のための大型言語モデル(LLM)を訓練することができる。
Nemotron-4340 Bは、ベースモデルBase、命令モデルInstruct、奨励モデルRewardを含む。英偉達は9兆個のtoken(テキスト単位)を使って訓練を行った。Nemotron-4340 B-Baseは、ARC-c、MMLU、BBHベンチマークテストなど ...
阅读全文