首页 报纸 正文

テクノロジー大手のマイクロソフトや、パラメータ5000億に達する新しいAI(人工知能)の大モデルを開発しており、グーグルやOpenAIを前面に打ち出している。
現地時間5月6日、外国メディアの報道によると、マイクロソフトはマイクロソフトがこれまで発表してきたオープンソースモデルの一部をはるかに上回る規模のMAI-1という最新のAIビッグモデルを開発しており、性能的にはグーグルのGemini 1.5、AnthropicのClaude 3、OpenAIのGPT-4などの有名なビッグモデルに匹敵するかもしれない。マイクロソフトまたは5月21日から開催されるBuild開発者大会でこの新モデルをデモする。
報道によると、MAI-1の開発は、元グーグルのAIリーダーでAIベンチャー企業のInflectionの最高経営責任者を務めたムスタファ・スレーマン(Mustafa Suleyman)がリードしている。今年3月には、Infectionへの最新の融資を受けたばかりで、マイクロソフトはInfectionからスレイマンを含む2人の共同創業者と一部の従業員を引き抜いた。ある関係者によると、マイクロソフトはこのためにInfectionに6億5000万ドル以上を支払ったという。
MAI-1はInflection傘下のモデルの技術の一部を参考にしている可能性があるが、マイクロソフトの従業員によると、MAI-1は新しい大言語モデルで、約5000億のパラメータを持ち、マイクロソフトがこれまで訓練してきたオープンソースモデルをはるかに上回っているという。1ヶ月前にマイクロソフトはPhi-3という小型AIモデルを発売したばかりで、その中でPhi-3 miniは携帯電話に配備できるように最適化され、38億パラメータを持ち、3.3兆tokenの訓練を経て、マイクロソフトはその性能がGPT-3.5などのモデルと同等だと主張した。
対照的に、MAI-1の規模ははるかに大きく、より多くの計算力の投入と訓練データも必要です。このモデルを訓練するために、Microsoftはすでに、OpenAIのGPT-4によって生成されたテキストやパブリックインターネットデータを含む、雄大なGPUを含むサーバクラスタを大量に構成し、さまざまなソースからトレーニングデータを収集している。これにより、MAI-1はOpenAIのGPT-4と似たレベルになり、後者は1兆を超えるパラメータを持っていると言われています。
PhiシリーズモデルとMAI-1の開発は、マイクロソフトがAI分野で二重戦略を取っていることを体現しており、モバイル機器のために小型ローカルモデルを開発しながら、クラウドによってサポートされるより大規模なモデルを開発している。しかし、マイクロソフト内部でもMAI-1の正確な用途は確認されていない。
さらに重要なことに、MAI-1は、マイクロソフトがAI分野でパートナーのOpenAIに完全に依存することを望んでいない技術を体現している。OpenAIからの技術は、Windowsに統合されたチャットロボットを含むマイクロソフトのさまざまな生成AI機能を駆動している。これまで、マイクロソフトのAIプラットフォームチームの従業員からは、同社のAI戦略はOpenAIとの協力関係に注目しすぎており、マイクロソフトのAIオリジナル研究に対する予算が減少しているとの苦情があった。
マイクロソフトのケビン・スコット最高技術責任者(Kevin Scott)は6日、領英に投稿し、MAI-1に関する報道に間接的に応えた。彼は、OpenAIはマイクロソフトが構築したスーパーコンピュータを使ってAIモデルを訓練しているが、マイクロソフトの研究部門と製品チームもAIモデルを構築していると述べた。
AIにおける突破を実現するために、マイクロソフトも積算力資源を買いだめしている。4月初め、マイクロソフトが今年末までに180万枚のAIチップを買いだめする計画を立てていると報じられた。これは、同社が2024年中に保有するGPUの数を2倍に増やしたいと考えていることを意味する。関係者によると、マイクロソフトは2024年度から2027年度(2027年6月30日まで)まで、GPUとデータセンターに約1000億ドルを費やす見通しだ。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

planewh 新手上路
  • 粉丝

    0

  • 关注

    0

  • 主题

    0