思いがけない競技場、グーグルとOpenAIがAIアシスタントを「ベンチ」に運ぶ
zhw2587
发表于 2024-5-16 12:13:47
4530
0
0
期待されていたAI検索ではなく、競争の焦点は突然AIスマートアシスタントに移った。
最近、OpenAIは多種類の入力を受け入れ、対応する出力を生成することができる万能モデルGPT-4 oを発表し、ミリ秒級反応と多モードインタラクションの新しい能力を示した。一方、グーグルはI/O開発者大会でAIアシスタントのアストラとフラッグシップモデルのGeminiを披露した。
一部の業界関係者は、OpenAIは今回予想された突破には至らず、既存の技術を統合したと考えている。また、グーグルのAI検索分野のレイアウトと革新、スマートフォンオペレーティングシステムの最適化への取り組みは、AI分野での深い蓄積と戦略的なレイアウトを示している。
試合は白熱化の段階に達し、単なる技術競争に別れを告げたようで、さらに応用とユーザー体験の競争である。影響要因が複雑になり、大きなモデルの最前線に集中しているOpenAIが勝者になる確率はどれくらいですか。
グーグルを奇襲、OpenAIがAIパーソナルアシスタントを一足先に発表
予想されていたAI検索をめぐる戦争は終わらず、AIスマートアシスタントに焦点が移った。
OpenAIは現地時間5月13日、グーグルのI/O総会の前日に発表会を開き、最新製品GPT-4 oを発表した。「o」はOmniであり、「全能」を意味する。OpenAI公式サイトによると、GPT-4 oは、テキスト、オーディオ、画像の任意の組み合わせを入力コンテンツとして受け入れ、テキスト、オーディオ、画像の任意の組み合わせの出力コンテンツを生成するため、より自然なヒューマン・マシン・インタラクションへの一歩だという。
OpenAIのミラ・ムラッティ最高技術責任者は発表会で、GPT-4 oの速度は既存のGPT-4 Turboより2倍速いが、コストはその半分にすぎないと述べた。GPT-4 oはリアルタイムでテキスト、音声、画像を推理することができ、応答時間はほぼ人間レベルに達する。
26分間の生放送では、GPT-4 oはそのミリ秒級の反応、人間の感情を識別して音声ビデオ対話を行い、多モード入出力が可能であるなどの一連の新能力を示した。一方、GPT-4 oはデスクトップとAPPをカバーし、ユーザーに完全に無料で提供しています。
グーグルはI/O開発者大会で、自分の万能なAI能力を示した。会議ではAIアシスタントのアストラ、文生図モデルのImagen 3、対標Soraの文生ビデオモデルのVeo、旗艦大モデルのGeminiなど、10種類以上の製品を連続して発表、更新した。
Googleのデモ動画では、AIアシスタントのAstraを使用する際に、携帯電話のカメラを開けて、任意のアイテムを合わせるだけで、AIはアイテムの名前を正確に言うことができます。携帯電話のカメラをある物体に向けるだけで、Geminiはそれを識別することができ、例えば赤いアップルのように、「レンズの中で何が音を出すことができるのか」という質問にも答えることができる。
また、グーグル側は、音声で深い双方向対話を行う能力を増やすことを含むGeminiのマルチモーダル機能を夏に拡張すると発表した。この機能はLiveと呼ばれる。GeminiLiveにより、ユーザーはGeminiと話すことができ、さまざまな自然な音の中から応答する音を選択することができます。ユーザーは自分のペースで話をしたり、回答中に質問を中断したり、明らかにしたりすることもできます。まるで人間の会話の中のようです。
毎日経済新聞はメディアの報道を引用して、アップルがOpenAIと今年、後者の技術の一部をiPhoneに導入することで合意していることを明らかにした。今回の発表会で、グーグル製品管理副社長のSameer Samat氏は、グーグルがGeminiを通じてアンドロイドOSをさらに最適化することを明らかにした。この最適化は、まずグーグルの自宅携帯電話Pixelに反映されるだろう。
GPT-5が欠席、OpenAIは減速?
OpenAIの突然の更新に対して、業界はもはや統一された称賛ではない。「発表会は驚いたが、グーグルが見終わったのは慌てなかったはずだ」とチーターモバイル会長兼CEOで、チーター星空会長の傅盛氏は個人の微博(ウェイボー)で述べた。
マイクロブログのスクリーンショット
5月14日に発表された短い動画で、傅盛氏は「すべての国内の人工知能従事者が夜更かしして海の向こうで核爆弾を発射するのを待っていたが、核爆弾が発射されていないのに、たくさんの砲を取り出した」と語った。彼は、このようなコメントは冗談だが、失望したのは今回のOpenAIがGPT-5.0を発表しておらず、GPT-4.5も見ておらず、むしろGPT-4 oを発表していることだと述べた。「画像、文字、音など、一連のエンジンを結合することで、切り替えに戻る必要はない」。
しかし、傅盛氏は続けて、「OpenAIは今回、より多くのユーザーに利用してもらうためには、リベットが十分に力を入れていると言えます。一連のアプリケーション、APIの値下げ、GPTの無料化、もちろんOpenAIがこの業界をより発展させ、私たちも真剣に学ぶことができることを望んでいます。今回の発表会は、アプリケーションが大いに役立つことを教えてくれました。すべての人が努力すべきです」と述べた。
「GPT-4 oが出てきて、また元より大きく進歩して、それ(OpenAI)はアップグレードするたびにいくつかの会社を“死”に追いやることができて、今回GPTのリアルタイム音声インタラクションをするいくつかのチームは、直接解散を宣言することができました」GPT-4 oが発表された翌日、ある大手モデル業界の創業者は「毎日経済新聞」の記者に感嘆した。
清華大学新聞学院元宇宙文化実験室主任の瀋陽氏も翌日、GPT-4 oを試用したが、発表された動画番号の中で、文生図の面では、GPT-4 oは毛髪の繊細さ、光影効果などの細部においてさらに優れていると述べた。
双方のスマートアシスタントでの接触に伴い、瀋陽氏は、現在の競争構図がより明確になったとみて、グーグルはGeminiベースのAIアシスタントをさらに推進しており、アップルとOpenAIも初歩的に協力し、アップルの携帯電話にChatGPTを搭載することに合意した。
瀋陽氏によると、今回の発表会を転換点として、ChatGPTはソウルメイトに改造され、実際にはSiriだったため、アップルが内蔵されたChatGPTでグーグルのGeminiに対抗する携帯電話アシスタントであることが産業構造が明らかになった。MetaもLlamaベースの携帯電話アシスタントをオンラインにする。産業にとって、AIアシスタントは1億人規模のユーザーから10億人規模への移行が期待されている。
「GPT-4 o、昨日発表された時は強大だと思っていましたが、今日はグーグルの最新の発表も完全にこれらの成績を追いつけたと思います。後のOpenAIはもっと緊張すべきだと思います。アプリ会社、超大手プラットフォーム会社がすべて追いつき、その優位性はますます少なくなっているからです」と順福キャピタルの創業者であり、銀行AIの李明順会長は「毎日経済新聞」の記者に語った。今のところOpenAIのユーザーの成長はあまり明らかではなく、技術のリードもコストの優位性も必ずしも最適ではなく、同時に、強応用時代はますます速く到来している。この背景の下で、グーグルは今回、すべてのアプリと大モデルを集合させ、より強いユーザーの粘性とユーザー依存度を形成するか、それともより優れている。
李明順氏によると、次の段階では、米国のプラットフォームアプリケーション会社、マイクロソフト、アップル、デル、中国のテンセント、バイト、アリが続々と自分のアプリケーションと大モデルの能力を結合し、スーパーアプリケーションを発売し、徐々に総合競争時代に歩み、大モデルで江山を打つのはさらに難しいだろう。
グーグルがOpenAI「包囲討伐」に対抗、検索争いは終わらず
大手の「ケーキ」を食べるのはそんなに簡単ではない。
発表会の前には、検索レイアウトをめぐるOpenAIの煙弾が市場にあふれており、OpenAIはChatGPT技術に基づく新しい検索エンジンを発売する可能性が高いとの報道があった。同時に、「GPTSEarch」というウェブページがオンラインになっていますが、現在は会員のみがアクセスできるようになっています。有名ジャーナリストのPeteHuang氏もツイッターで、GPTSEarchが5月9日に正式にオンラインになると予告した。
最終的にこのラウンドでグーグルは陣地を守った。グーグルのサンダル・ピチャイ最高経営責任者(Sundar Pichai)は講演で、Geminiがもたらした最もエキサイティングな変革の1つはGoogle検索における「私たちの最大の投資と革新分野の1つは、私たちの創始製品である検索」だと述べた。
発表会を見ると、グーグルはAI能力と検索エンジンを先に結合した。グーグル側は、グーグルの検索エンジンの結果をまとめられる「AI概要」(AI Overviews)機能を今週、米国で発売すると発表した。この機能では、GoogleはAIが生成した答えをユーザーに示します。
グーグルによると、AIの概要は複雑な検索に対応し、ユーザーがソリューションを求めるのを支援するためだという。例えば、菜食の準備や旅行計画を検索すると、AIが提供する答えが検索ページの上部に表示されます。
グーグルは検索の視覚機能も向上し、動画を通じた問題提起をサポートしている。I/O大会でグーグルは、レコードプレーヤーの故障に直面した際に、ユーザーが動画を撮影しながら質問し、新しい検索を通じて修理手順やリソースを含むAIの概要を得ることができることをデモした。
スマートアシスタントレベルでグーグルの新製品を一足先に狙撃したが、市場が期待している検索製品については、GPT-3.5が発表されて以来期待されていた革命的な機能だが、煙弾が相次いだ後も、さらなる動きは見られなかった。検索市場では、グーグルの基本的なディスクは依然として安定しており、同時にその全面的なAI能力はかすかに包囲の勢いを形成している。
大手と領地を争うもう一つの側面は、OpenAIにとって内憂の隠れた危険がある。
昨年の内闘の余波の後、GPT-4 oが発表されてから1日後、大衆の目に長く消えていたOpenAI共同創業者で首席科学者のIlya Sutskever官がOpenAIを去ると宣言した。昨年11月、OpenAI経営陣は動揺し、Sutskeverはこの波紋の背後にある推進者とされていた。先日、OpenAI創設メンバーの1人であるAndrejKarpathyもSoraの発表を前に退職した。
この新しい技術革命では、競争の重点が大モデル技術からより責任ある応用側に移るにつれ、ダークホースの姿勢で一度方向をリードしたOpenAIが減速し始め、新たな転換点が現れているかもしれない。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
-
アリババは、26億5000万ドルのドル建て優先無担保手形と170億元の人民元建て優先無担保手形の定価を発表した。ドル債の発行は2024年11月26日に終了する予定です。人民元債券の発行は2024年11月28日に終了する予定だ ...
- SOGO
- 前天 09:05
- 支持
- 反对
- 回复
- 收藏
-
スターバックスが中国事業の株式売却の可能性を検討していることが明らかになった。 11月21日、外国メディアによると、スターバックスは中国事業の株式売却を検討している。関係者によると、スターバックスは中国事 ...
- 献世八宝掌
- 昨天 16:29
- 支持
- 反对
- 回复
- 收藏
-
米東時間11月18日、米株終値は反落し、ダウ平均は3営業日連続で下落した。ナスダック・金龍中国指数は上昇した。米株BAKTは162.37%上昇し、盤中5回の溶断メカニズムをトリガした。 大口商品では、WTI原油価格が上昇 ...
- 就放荡不羁就h
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
【意法半導体CEO:中国市場は非常に重要で華虹と協力を展開】北京時間11月21日、意法半導体(STM.N)は投資家活動の現場で、同社が中国ウェハー代工場の華虹公司(688347.SH)と協力していると発表した。伊仏半導体 ...
- 黄俊琼
- 昨天 14:29
- 支持
- 反对
- 回复
- 收藏