首页 报纸 正文

グーグルが重点的に開発したと噂されているGemeniモデルが、今日ついに正式に姿を現した。
グーグルの公式サイトは現地時間12月6日、3つのキットを含む「私たち史上最大、最強のAIモデルGemini」を紹介した。
Gemini Ultra--グーグルの参数が最も大きく、性能が最も強いモデルは、高度に複雑なタスクに適している、
Gemini Pro:さまざまなタスクを拡張できるモデル、
Gemini Nano-効率的なデバイス側タスクモデル。
Geminiシリーズモデルは多モード、柔軟性の2つの能力を主力としている。公式サイトではGeminiを「ネイティブマルチモーダル」(natively multimodal)モデルと定義している。Geminiの出荷時の設定は「全科発展」であり、複数の感覚官がモデル内で統一的に学習し、単独で学習して結合するのではなく、後者はGPTなどのモデルが採用した標準的なやり方であり、「偏科」の問題をもたらす可能性があり、つまり文字や画像の処理がより得意であると理解できる。
これは、Geminiがテキスト、コード、オーディオ、画像、ビデオなどの異なるタイプの情報を直接理解することができ、追加の変換を必要とせず、さまざまなモダリティの性能もよりバランスがとれていることを意味します。
公式サイトによると、ネイティブマルチモーダル能力はGemeniが「より複雑な質問に答えることができる」ようにし、「数学や物理などの複雑な学科の推理を説明するのが特に得意」だという。公式サイトでは、MMLU(大規模マルチタスク言語理解)のテスト結果であるMMLUテストは、大学の数学、物理、経済学、社会科学などの一連の問題を含むモデルがテキストと画像を処理する能力を測定することを目的としていることを強調している。Gemini Ultraの得点は90.0%に達し、初めて人間の専門家を超えた。
特筆すべきは、32の性能テスト基準のうち、Geminiは30項目のスコアがGPT-4を上回っているが、ほとんどの差は小さい。
柔軟性の面では、Googleはより多くのモデルアプリケーションの選択肢を提供している。例えばGemini Nanoは最軽量モデルとして、メモリスペースが限られたモバイル機器に適しています。このモデルは12月に初めてグーグルの携帯電話Pixel 8 Proに内蔵され、録音自動、キーボード知能応答の2つの機能をサポートし、将来的にはAndroid携帯電話のオフライン運転に多くの機能を置く予定だ。グーグルのサンダ・ピーチェCEOはまた、Geminiはグーグル検索、広告マーケティング、Chromeブラウザ、Duet AIなど、より多くの製品やサービスに登場すると述べた。
「我々は確かにGeminiが新しい分野を全面的に切り開いているのを見ている」とグーグルのDeepMind製品副社長は最近の電話会議で述べたが、ビッグモデルにはまだ侮れない幻覚、偏見、悪用の問題があることを認めた。本格的にGPT-4を指し示すGemini Ultraモデルは現在、内部、外部のレッドチームのセキュリティテストを受けており、来年初めにオンラインになる予定だ。
注目すべきは、Gemini Ultraモデルでサポートされる対話ロボットBardが、最大の更新を迎えることです。更新されたBardは170以上の国・地域でサービスを提供する予定ですが、EUや英国は含まれていません。Bardを担当するグーグルの副社長は、同社が現地の規制当局と「接触」を続けるためだと述べた。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

赖振俊 新手上路
  • 粉丝

    0

  • 关注

    0

  • 主题

    0