首页 报纸 正文

今週、人工知能分野のトップニュースは間違いなくOpenAIとグーグルの製品対決だ。
OpenAI社は、競合他社の重大な製品発表会の前に自社製品を優先的に発表し、ニュースの焦点を奪ってきたが、今週も例外ではない。
OpenAIは以前から高い期待値を与えており、月曜日(5月13日)、同社は予定通りGPT-4のアップグレード版を発表した。GPT-4 o(「o」はomniの全方位を表す)という。GPT-4 oは、携帯電話やタブレット上のパーソナルアシスタントとして機能することを目的としており、音声対話機能の改善、デバイスカメラが撮影した写真の解釈と推理、より強力な言語翻訳能力、より速い応答時間を提供することができます。
GPT-4 oの背後にある技術革新は印象的で、このモデルはマルチモーダルで、リアルタイムでオーディオ、視覚、テキストを受信、推理し、テキスト、オーディオ、画像の任意の組合せ出力を生成することができる。モデルは過去のバージョンと比較して、ユーザーの声をテキストに変換して処理する手順を省き、プロセス全体がより迅速になることを意味します。
GPT−4 oはまた、モデルが特定の数のtokenを処理するのに必要な時間(英語のテキストの場合、1つのtokenは通常1つの半単語に等しい)を短縮し、これにより、このモデルはOpenAIの前の最適モデルGPT−4 Turboよりも速く、安価に動作するようになった。
火曜日(5月14日)、グーグルも大技を連発し、正面はオープンAIに硬くなったばかりだ。
グーグルのI/O開発者大会で、グーグルはGeminiモデルの広範なアップグレード、将来の人工知能アシスタント「アストラ」、生成式人工知能賦能グーグル検索、画像、音楽、ビデオに関する生成式AIツールなど、新しい人工知能機能と間もなく発表される製品を発表した。
グーグルは会議でGemini 1.5 Proモデルの改良を発表し、100万tokensのコンテキストウィンドウをさらに200万に拡大し、より自然な音、オーディオと画像をよりよく理解し、より強い論理推理と計画能力、およびより良い計算機コード生成能力を持つことができるようにした。
さらに、グーグルはオーディオやビデオなどのマルチモーダルな入力コンテンツを処理するための高度な視覚と対話応答インテリジェントボディプロジェクトAstraを発表した。OpenAIのGPT-4 oは静止画しか処理できないのに対し、Astraはビデオも処理できる。デモビデオでは、カメラ映像を通じて、「何が音を出すのか」、「今どこにいるのか」などのコマンドを識別することができます。しかし、その対応には遅れや遅れがあり、グーグルの将来版の人工知能パーソナルアシスタントが「アストラ」を通じて開発しているという。
人工知能アシスタントの「ハイライト時刻」
OpenAIとグーグルの製品発表を見ると、テクノロジー企業は人工知能アシスタントの研究開発を非常に重視しており、「初の人工知能キラー級アプリケーション」の位置はシリコンバレーの各家庭の「必争の地」となっている。
今週の製品発表状況を見ると、OpenAIとグーグルの人工知能アシスタントはそれぞれ優位性がある。GPT-4 oは音声を直接受信して生成することができ、音声をテキストに変換するプロセスを省くことができる、一方、Astraはビデオのような動画を扱うことができ、これは顕著な利点である。
この2つの製品の発表は、シリコンバレーの他の2つの大手アップルとアマゾンを不利にしたことが明らかになった。彼らは、これらの新しい競合他社の能力に追いつくために音声アシスタントのSiriとAlexaをアップグレードする必要があります。そうしないと、これらの製品は苦境に陥ることになります。現在知られている情報については、アマゾンが投資しているAnthropicは、強力なClaude AIモデルを使用することができます。アップルが短期間で技術許可を得るためにOpenAIと交渉しているという報道もあった。
しかし、これらの新しい人工知能アシスタントは将来の「人工知能キラー級アプリケーション」になるのだろうか。この結論はまだ定説がなく、次に何が起こるかにかかっている。
現在の人工知能アシスタントの使用例を見ると、人間の日常生活において必要なものとは言えず、翻訳機能以外に仕事を助けることができるものはほとんどありません。
この状況は、ヘルパーがエージェント属性をより多く持っている場合に変化する可能性があるという分析があります。いつか、人間の個人的好みを本当に理解し、人々の好みに合わせて任務を遂行することができ、日常生活の中でいくつかのこと(例えば、オンラインショッピング、保険用紙の記入、休暇の予約など)を手伝うことができる場合、人工知能アシスタントは「キラー級の応用」になる可能性が高い。
グーグルは現在、このような製品を開発していると表明しているが、製品発表のスケジュールは示していない。OpenAIも「間もなく」エキサイティングな未来の公告を発表することを明らかにし続けている。来週、マイクロソフトはBuild開発者大会を開催する。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

孤独的男孩 新手上路
  • 粉丝

    0

  • 关注

    0

  • 主题

    2