Metaが発表した「最強オープンソース大モデル」オープンソースとクローズソースの争い新しいページの大モデルを開くか、シャッフルを迎える
愿为素心人
发表于 2024-7-28 10:40:20
199
0
0
Metaは現地時間7月23日、最新バージョンの言語大モデルLlama 3.1を正式に発表した。今回の発表はAIコミュニティから「オープンソース後進論」への強力な反撃とされ、Meta創業者でCEOのザッカーバーグ氏も発表時に「オープンソースAIは未来への道だ」と述べた。
従来、OpenAIはChatGPTの閉鎖性のため、「Open」と呼ばれているが実際には「Close」のことをしていると非難されてきたが、ChatGPT-4 oに代表される閉源大モデルの実力は業界を退却させることが多く、「閉源大モデルの性能は必ず開源大モデルより強い」という考えがデフォルトになっているようだ。
しかし、今回のLlama 3.1のリリースはこの構造を上書きするようだ。今回のMetaは、8 B、70 B、405 BのLlama 3.1の3つのバージョンをリリースしました。このうち405 Bは「トップフィット」バージョンで、Metaは最高の閉源モデルに匹敵する性能を誇ると言われています。
「最強オープンソース大モデル」
Llama 3.1 405 Bはなぜ最高の閉源モデルと競争できるのか。Llama 3.1を発表すると同時に、Metaも「The Llama 3 Herd of Models」と題する論文を発表し、その中でLlama 3モデルの研究開発の詳細を詳しく述べた。
まず、使用上、Llama 3.1は8つの言語をサポートし、3つのバージョンのコンテキストウィンドウはGPT-4 Turboと同じ128 Kに拡張されています。同時に、Llama 3.1 405 Bは4050億個のモデルパラメータを持ち、訓練規模はLlama 2の50倍であり、より安定した性能を維持するために密集Transformerアーキテクチャを採用している。これにより、Llamaが一度に処理できるテキストの数は9.6万字に達し、同時に長いテキストでも短いテキストでも、「思い通りに」処理することができる。
論文では、MetaもLlama 3.1 405 BとChatGPT-4 oとClaude 3.5 Sonnetのこれらの頭部閉源大モデルの性能比較データを発表した。テストの結果、Llama 3.1 405 Bは汎用性能、長テキスト処理、多言語処理の多方面で得点がリードしていることが分かった。例えば、ZeroSCROLLSプロジェクトのテストでは、Llama 3.1 405 Bのスコアは95.2で、後の両方は90.5です。
優れた性能と膨大な訓練基数を表現することで、Llama 3.1は「最強オープンソース大モデル」の称号を持つようになったが、現在のLlama 3.1は依然として言語処理を主とする大モデルであり、画像、ビデオ、音声の処理をサポートしていない。これは、多モードタスク処理において、ChatGPTが依然として際立った能力を持っていることを意味する。
「オープンソースAIは未来の道」
Llamaの実際の使用体験はまだ完璧なほどではないかもしれないが、今回のLlama 3.1 405 Bの発表は、世界中のAIワーカーにとって最大の意味はやはり大モデルのオープンソースとクローズソースの争いが新たなページを開いたことにある。
メッタの公式サイトでザッカーバーグ氏は公開書簡を発表し、「オープンソースAIは未来への道だ」と力強く宣言した。同書によると、複数の企業が先行するクローズドソースモデルを開発しているにもかかわらず、オープンソースは急速に差を縮めているという。Llamaを例にとると、昨年のLlama 2は汎用大モデルの古いバージョンにしか匹敵できなかったが、今年のLlama 3は最先端の大モデルと競争し、一部の分野でリードしている。
そのため、ザッカーバーグ氏はLlamaを大モデル時代のLinuxにして、オープンソースAIの業界標準にしたいと考えている。「高性能コンピューティングの初期には、主要技術会社が独自のクローズドソースUnixバージョンの開発に巨額を投じていました……今日、オープンソースのLinuxはクラウドコンピューティングとモバイルデバイスのほとんどを実行するオペレーティングシステムの工業標準的な基礎となり、人工知能は同様の方法で発展すると信じています」
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- DeepMindのオープンソース生体分子予測モデルノーベル賞の成果はAI製薬の波を巻き起こすのか?
- 百度李彦宏:過去24カ月、AI業界の最大の変化は大モデルが幻覚をほぼ解消したことだ
- 「AI新世代」の大モデルメーカーがスマートボディを“巻き”、李彦宏氏は「アイデアで稼げる時代が来る」と語る
- 李彦宏氏によると、大模型幻覚は実測文心をほぼ解消したという。
- FTCはマイクロソフトのクラウドコンピューティング事業の反競争行為に関する調査を計画している
- 文心の一言でユーザー数が4億人を突破、百度呉甘:大モデルが産業知能エンジンを再構築中
- アリババの呉泳銘CEO:AIの発展には異なる規模、異なる分野のオープンソースの大モデルが必要だ
- 百度Q 3コアの純利益17%増予想を上回る文心大モデルの1日の調達量は15億元に
- 2024 Q 3電話会:予想以上に収益が上がらない競争への挑戦が激化
-
米東時間の金曜日、米株3大指数は集団で上昇し、終値を締め切ると、ダウは0.97%上昇し、今週は1.96%上昇した。納指は0.16%上昇し、今週は1.73%上昇した。スタンダード500指数は0.35%上昇し、今週は1.68%上昇した。 ...
- leekhy
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
イランは現地時間の金曜日(11月22日)、国際原子力機関(IAEA)がイランに圧力をかけている新たな決議に応えるため、大量の遠心分離機を追加してウラン濃縮を行うと発表した。 IAEA理事会は木曜日、イランの協力不 ...
- 1900_后
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
9月以来、香港株の1日当たりの出来高は大幅に増加し、流動性の回復は中資証券会社の業績の反発を牽引し、富途証券、タイガー証券などのインターネット証券会社の年間獲得目標は早期に達成された。 証券会社の中国人 ...
- 拓牛李强
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
蔚来法務部は11月22日、インターネット上に流出した蔚来と他の企業の資本レベルのデマについて、会社が最初に通報し、受理されたと発表した。会社はすでにこのデマの全リンク推進過程と、マルチプラットフォームが ...
- 愿为素心人
- 3 天前
- 支持
- 反对
- 回复
- 收藏