グーグル、Geminiモデル30件の性能テストスコアをGPT-4を上回ると発表

赖振俊发表于 2023-12-7 15:11:51

1300 0 0

グーグルが重点的に開発したと噂されているGemeniモデルが、今日ついに正式に姿を現した。
グーグルの公式サイトは現地時間12月6日、3つのキットを含む「私たち史上最大、最強のAIモデルGemini」を紹介した。
Gemini Ultra--グーグルの参数が最も大きく、性能が最も強いモデルは、高度に複雑なタスクに適している、
Gemini Pro：さまざまなタスクを拡張できるモデル、
Gemini Nano-効率的なデバイス側タスクモデル。
Geminiシリーズモデルは多モード、柔軟性の2つの能力を主力としている。公式サイトではGeminiを「ネイティブマルチモーダル」（natively multimodal）モデルと定義している。Geminiの出荷時の設定は「全科発展」であり、複数の感覚官がモデル内で統一的に学習し、単独で学習して結合するのではなく、後者はGPTなどのモデルが採用した標準的なやり方であり、「偏科」の問題をもたらす可能性があり、つまり文字や画像の処理がより得意であると理解できる。
これは、Geminiがテキスト、コード、オーディオ、画像、ビデオなどの異なるタイプの情報を直接理解することができ、追加の変換を必要とせず、さまざまなモダリティの性能もよりバランスがとれていることを意味します。
公式サイトによると、ネイティブマルチモーダル能力はGemeniが「より複雑な質問に答えることができる」ようにし、「数学や物理などの複雑な学科の推理を説明するのが特に得意」だという。公式サイトでは、MMLU（大規模マルチタスク言語理解）のテスト結果であるMMLUテストは、大学の数学、物理、経済学、社会科学などの一連の問題を含むモデルがテキストと画像を処理する能力を測定することを目的としていることを強調している。Gemini Ultraの得点は90.0%に達し、初めて人間の専門家を超えた。
特筆すべきは、32の性能テスト基準のうち、Geminiは30項目のスコアがGPT-4を上回っているが、ほとんどの差は小さい。
柔軟性の面では、Googleはより多くのモデルアプリケーションの選択肢を提供している。例えばGemini Nanoは最軽量モデルとして、メモリスペースが限られたモバイル機器に適しています。このモデルは12月に初めてグーグルの携帯電話Pixel 8 Proに内蔵され、録音自動、キーボード知能応答の2つの機能をサポートし、将来的にはAndroid携帯電話のオフライン運転に多くの機能を置く予定だ。グーグルのサンダ・ピーチェCEOはまた、Geminiはグーグル検索、広告マーケティング、Chromeブラウザ、Duet AIなど、より多くの製品やサービスに登場すると述べた。
「我々は確かにGeminiが新しい分野を全面的に切り開いているのを見ている」とグーグルのDeepMind製品副社長は最近の電話会議で述べたが、ビッグモデルにはまだ侮れない幻覚、偏見、悪用の問題があることを認めた。本格的にGPT-4を指し示すGemini Ultraモデルは現在、内部、外部のレッドチームのセキュリティテストを受けており、来年初めにオンラインになる予定だ。
注目すべきは、Gemini Ultraモデルでサポートされる対話ロボットBardが、最大の更新を迎えることです。更新されたBardは170以上の国・地域でサービスを提供する予定ですが、EUや英国は含まれていません。Bardを担当するグーグルの副社長は、同社が現地の規制当局と「接触」を続けるためだと述べた。

グーグル、Geminiモデル30件の性能テストスコアをGPT-4を上回ると発表

大規模財経丨新東方2025年度1季報：董宇輝がいなくなってから、東方オーディションは損をし始めた

百済神州幹部の殷敏氏が調査され、これまでアスファルトに勤務していたことが明らかになった。

木曜日の人気中間株の大半が下落ナスダック中国金龍指数は0.82%下落

米株の出来高上位20位：テスラは今週22%の大幅上昇