グーグルがOpenAI奇襲に反撃:生成型AI版検索エンジンなどの大モデル「ファミリーバケツ」を発表
寒郁轩良
发表于 2024-5-15 11:15:41
183
0
0
OpenAIが春の発表会を開いた翌日、グーグルは新しいI/O開発者大会で対戦した。
このイベントは北京時間5月15日午前1時から「火薬の味」がいっぱいだ。グーグルは会議で「すべてを宣言する」を選択した:AIアシスタントのアストラ、文生図モデルのImagen 3、対標Soraの文生ビデオモデルのVeo、注目されているフラッグシップモデルのGeminiなど、10種類以上の製品を連続的に発表、更新した。
OpenAI「鳩」が検索を落とし、最新のフラッグシップモデルGPT-4 oを発売した後、長い間検索の覇者の地位を占めてきたグーグルは、AI検索を再設計しただけでなく、AI認識図アシスタントも同時に発売した。
Geminiの新音声対話機能Liveは、OpenAIを直接ターゲットにしたGPT-4 oであり、同様に携帯電話を通じてリアルタイムに周囲の状況を聞くことができ、会話を中断してもすぐにフォローすることができる。
また、GoogleブラウザChromeにGemini Nanoが追加されます。後者はGeminiシリーズの軽量版で、主にモバイル機器向けに設計されている。
グーグルはまた、別の小型モデルGemma 2.0を今夏に発売すると発表した。オープンソースモデルのPaliGemmaを含め、写真をマークしたり、画像にタイトルを付けたりすることができる。GemmaモデルはGeminiモデルと同じ技術スタックを採用しているが、規模が小さく、リソースが制限されている環境への導入に適している。
人工知能コンテストもスマートフォンを競うコンテストであることが大きい。グーグルのSameer Samat製品管理副社長は、グーグルがGeminiを通じてアンドロイドOSをさらに最適化することを明らかにした。この最適化は、まずグーグルの自宅携帯電話Pixelに反映されるだろう。
Geminiは明らかに今回の発表会の主役であり、この中で特に多モードと長コンテキスト技術でより多くのインクが塗られている。
過去数カ月、グーグルは長いコンテキストプレビューが可能なGemini 1.5 Proを発売し、翻訳、コーディング、推理の面で一連の改善を行ってきた。現在、Gemini 1.5 Proのコンテキスト長は100万token(テキスト処理の基本単位)から200万tokenに更新されており、3カ月で倍増し、同社が外部への「筋肉ショー」を急いでいることを示している。
この時点でGeminiが登場してから1年が経ち、この多くのモダリティモデルはテキスト、画像、ビデオ、コードなどを横断して推理することができるようになった。グーグルによると、20億人以上のユーザーと150万人以上の開発者がGeminiモデルを使用しており、このモデルはコードをデバッグし、新しい知見を得て次世代の人工知能アプリケーションを構築するために使用できる。
グーグルは、このモデルの多様な特性をさらに示すために、検索、写真、アンドロイドシステムなどの異なるシーンについてより詳細に紹介している。
例えば検索では、Geminiは包括的なAI化改造をもたらした。ユーザーは、更新、より長く、より複雑な質問をして検索したり、写真を使って検索したりすることができます。グーグルは今週、米国地域で「AIの概要」検索を開始する予定で、他の国では後続する。
グーグルは現場で「写真を問い合わせる」機能を示した。駐車場で料金を払っているのにナンバープレートの番号を忘れてしまった場合、通常は携帯電話の写真の中でキーワードを検索し、多くの過去の写真を見てナンバープレートを探すことができます。しかし今では、写真を尋ねるだけで、よく登場する車を正確に知らせ、車を三角測量し、ナンバープレートを伝えることができるようになった。
例えば、自分の子供が水泳を覚えたのはいつなのか写真に質問することができます。いっそ写真に子供の水泳の進展を教えてもらうこともできます。
Geminiは単なるチャットロボットではなく、個人アシスタントでもあり、ユーザーが複雑なタスクを処理したり、行動したりするのを助けることができます。Gemini 1.5 ProはGoogleクラウドコンピューティングサービスGoogle Work spaceにも導入されている。グーグルは、Geminiはすべての作業に必要なステップを完了できると主張している。返品を例にとると、AIはメールで領収書を検索し、対応する注文番号を見つけ、返品フォームに自動的に記入し、受け取りを手配することができる。
大きなモデルは計算力の競争であり、最先端のモデルを訓練するには大量の計算力が必要である。過去6年間で、業界の機械学習コンピューティングへの需要は100万倍に増加し、毎年10倍に増加しています。AI時代の重要な参加者として、グーグルもインフラ面で力を入れている。
その夜、グーグルは第6世代TPU(グーグルが機械学習のワークロードを加速させるために設計した応用特定集積回路)である「Trillium」を発表し、Trilliumはこれまでで最も性能が高く、効率が高いTPUであり、前世代TPU v 5 eに比べてチップ当たりの計算性能が4.7倍向上し、今年末に顧客に提供する計画だ。
Geminiは完全にグーグル自己研究の第4世代と第5世代TPUで訓練とサービスを受け、Anthropicを含む他の先進的な人工知能会社もTPUで彼らのモデルを訓練した。
しかし、グーグルがさまざまな製品にAI機能を「注入」すると同時に、ユーザーがプライバシーデータをより多く譲渡する必要があることを意味している。これに対し、グーグルはプラットフォーム上のユーザーファイルを使用してGeminiや他の人工知能モデルを訓練しないことを約束した。
グーグルのピチャイCEOは、同日の発表会で121回の「AI」に言及したことで、グーグルに対するAIの重要性を示すことができると述べた。しかし、重要性を強調する以外に、OpenAIに対する外部から期待されているこの反撃は、これ以上の驚きをもたらしていない。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- 百度李彦宏:过去24个月,AI行业最大变化是大模型基本消除了幻觉
- 「AI新世代」大模型厂商齐“卷”智能体,李彦宏称将迎来“靠想法就能赚钱时代”
- 李彦宏说大模型幻觉基本消除了 实测文心一言到底怎么样?
- 百度发布两款“超级有用”应用,李彦宏:大模型变得可用可信
- AI周报|杨植麟称kimi月活超3600万;李彦宏:大模型幻觉基本消除了
- 百度吴甜:大模型重塑产业智能引擎
- 大模型重塑产业智能引擎 百度分享文心大模型最新进展
- 文心一言用户数破4亿,百度吴甜:大模型正重塑产业智能引擎
- 阿里巴巴CEO吴泳铭:AI发展需要一批不同规模、不同领域的开源大模型
- 百度Q3核心净利润增长17%超预期 文心大模型日调用量达15亿
-
11月21日、2024世界インターネット大会烏鎮サミットで、創業者、CEOの周源氏が大会デジタル教育フォーラムとインターネット企業家フォーラムでそれぞれ講演、発言したことを知っている。周源氏によると、デジタル教 ...
- 不正经的工程师
- 3 小时前
- 支持
- 反对
- 回复
- 收藏
-
アリババは、26億5000万ドルのドル建て優先無担保手形と170億元の人民元建て優先無担保手形の定価を発表した。ドル債の発行は2024年11月26日に終了する予定です。人民元債券の発行は2024年11月28日に終了する予定だ ...
- SOGO
- 前天 09:05
- 支持
- 反对
- 回复
- 收藏
-
スターバックスが中国事業の株式売却の可能性を検討していることが明らかになった。 11月21日、外国メディアによると、スターバックスは中国事業の株式売却を検討している。関係者によると、スターバックスは中国事 ...
- 献世八宝掌
- 昨天 16:29
- 支持
- 反对
- 回复
- 收藏
-
【意法半導体CEO:中国市場は非常に重要で華虹と協力を展開】北京時間11月21日、意法半導体(STM.N)は投資家活動の現場で、同社が中国ウェハー代工場の華虹公司(688347.SH)と協力していると発表した。伊仏半導体 ...
- 黄俊琼
- 昨天 14:29
- 支持
- 反对
- 回复
- 收藏