Nvidia Open Source 340 Billion Parameter Model Nemotron-4 340B
海角七号
发表于 2024-6-15 16:13:55
223
0
0
On June 14th local time, Nvidia opened up the Nemotron-4 340B (340 billion parameter) series model. According to NVIDIA, developers can use this series of models to generate synthetic data for training Large Language Models (LLMs) for commercial applications in healthcare, finance, manufacturing, retail, and other industries.
The Nemotron-4 340B includes the base model, instruction model, and reward model. Nvidia used 9 trillion tokens (text units) for training. In common sense reasoning tasks such as ARC-c, MMLU, and BBH benchmark tests, Nemotron-4 340B-Base can be comparable to Llama-3 70B, Mixture 8x22B, and Qwen-2 72B models.
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- Global Finance: Market pays attention to Nvidia's performance. The three major stock indexes of the New York Stock Exchange fluctuated on the 20th
- Nvidia's Q4 performance guidance fell short of the highest expectations, and its stock price fell more than 5% after hours
- Alibaba CEO Wu Yongming: AI development requires a batch of open-source models of different scales and fields
- Nvidia's third quarter revenue reached $35.082 billion
- Baidu's Q3 core net profit increased by 17%, exceeding expectations. Wenxin's large model daily usage reached 1.5 billion
- NVIDIA's performance growth slows down, Huang Renxun steps in to 'appease' the market! Analyst: Investors Underestimate Demand for Blackwell Chips
- Nvidia's Q4 performance guidance falls short of the highest expected stock price, with a drop of over 5% after the market closed
- The stock price has skyrocketed by 33%! Snowflakes overshadow Nvidia analysts: AI software outperforms semiconductors or trends
- The three major US stock indices collectively closed higher, while the Dow Jones Industrial Average rose more than 1%. Nvidia's stock price hit a new intraday high
-
11月21日、2024世界インターネット大会烏鎮サミットで、創業者、CEOの周源氏が大会デジタル教育フォーラムとインターネット企業家フォーラムでそれぞれ講演、発言したことを知っている。周源氏によると、デジタル教 ...
- 不正经的工程师
- 3 小时前
- 支持
- 反对
- 回复
- 收藏
-
アリババは、26億5000万ドルのドル建て優先無担保手形と170億元の人民元建て優先無担保手形の定価を発表した。ドル債の発行は2024年11月26日に終了する予定です。人民元債券の発行は2024年11月28日に終了する予定だ ...
- SOGO
- 前天 09:05
- 支持
- 反对
- 回复
- 收藏
-
スターバックスが中国事業の株式売却の可能性を検討していることが明らかになった。 11月21日、外国メディアによると、スターバックスは中国事業の株式売却を検討している。関係者によると、スターバックスは中国事 ...
- 献世八宝掌
- 昨天 16:29
- 支持
- 反对
- 回复
- 收藏
-
【意法半導体CEO:中国市場は非常に重要で華虹と協力を展開】北京時間11月21日、意法半導体(STM.N)は投資家活動の現場で、同社が中国ウェハー代工場の華虹公司(688347.SH)と協力していると発表した。伊仏半導体 ...
- 黄俊琼
- 昨天 14:29
- 支持
- 反对
- 回复
- 收藏