找回密码
 立即注册
搜索
热搜: Apple Tesla Amazon
查看: 1283|回复: 0

OpenAIの「次の重大な突破」初のAIアシスタント製品か、来年1月に発表されるヒューマン・インタラクションの変革は到来したのか。

[复制链接]

2

主题

0

回帖

10

积分

新手上路

积分
10
发表于 2024-11-14 11:06:44 | 显示全部楼层 |阅读模式

メディアの報道によると、OpenAIはコードの作成、旅行の予約、電子商取引の自動買い物など、さまざまな複雑な操作を自動的に実行できる「Operator」という新しいAIアシスタント製品を発売する準備をしている。内部従業員の暴露によると、OpenAIリーダー層は2025年1月に同製品を発表する予定で、まず研究プレビュー版と開発ツールとして発売され、その際に開発者のためにAPIインタフェースを開放する。
記事によると、OpenAIはスマートボディに関するいくつかの研究プロジェクトを行ってきたという。ある人は、最も完成に近いのはWebブラウザでタスクを実行するための汎用ツールだと述べています。
AIアシスタント(AI Agent)は環境を感知し、意思決定と実行動作を行うことができるインテリジェントなエンティティであり、独立した思考、ツールを呼び出して所与の目標を段階的に達成する能力を備えており、C端に個性的な応用を提供することができるだけでなく、B端にコスト削減の効果的な方案を提供することもできる。一般ユーザーにとって、AIアシスタントの最も核心的な機能はAIが携帯電話を自律的に操作し、複雑な推理任務を支援することである。
OpenAIのアルトマン最高経営責任者はすでに退場の意思を明らかにしている。数週間前、Redditの「私に何でも聞いて」(Ask Me Anything)フォーラムで、「私たちはますます良いモデルを持っているが、次の大きな突破はAIアシスタントだと思う」と述べた。先月の同社の年次開発日に先立ったOpenAI記者会見で、同社のケビン・ワイル最高製品責任者は「2025年はエージェントシステムが最終的に主流に入る年になると思う」と述べた。
OpenAIの視点に立つと、ビジネス化の過程でますます大きな圧力に直面しており、ChatGPTの漸進的な改善はユーザーにより高い価格を支払うことを引き付けることができない可能性がある。幹部はAI開発への巨額の投資が価値があることを証明するために、画期的な製品を必要としている。
現在、OpenAIは多機能連携AI AgentであるSwarmをオープンソースしており、より効率的にタスクを遂行するために複数のエージェント連携を作成することができます。そのGPT o 1モデルは推論能力を強化し、複雑な問題の解決とユーザー相互作用の自然性の面で顕著な進歩を遂げ、AIエージェントシーンにもさらに適用できるようにした。
AIアシスタントはAGIへのコア基盤と見なされており、ハードウェアメーカーが必ずAIと呼ぶ時代には、AIアシスタントは端末のインテリジェント化の突破口となるかもしれない。甬興証券によると、AIエージェントはモバイル相互接続の新たな入り口を掌握するか、流量分配構造はAIエージェントエージェントの知能体が比較的強い相互作用性と利便性を備えているため、あるいは元の同じ端末の異なるApp間の天然障壁を打ち破ることができることが期待されている。
「科創板日報」の不完全な整理によると、国内外のヘッドメーカーがAIアシスタント製品の発売を争っている--
マイクロソフトは最近、パーソナルコンピュータを操作するためにユーザーが個人的なスマートボディを作成するのを支援するAIツールOmniParserを低調にオープンした。マイクロソフトは10月22日、Dynamics 365に10個の自主AIエージェントを統合し、OpenAI最新モデルo 1をサポートし、自主学習能力を備え、プラットフォーム間の複雑な業務を自動的に実行できる、9月、マイクロソフトはWindowsエージェント・アリーナというベンチマーク・フレームワークを発表し、同じくAIアシスタント開発のカテゴリーに属している。
The Informationによると、グーグルは12月に大規模なアクションモデル「Project Jarvis」をプレビューする予定で、このプロジェクトはユーザーが「研究の収集、製品の購入、フライトの予約」などのタスクを実行するのを支援する。
10月22日、Anthropicは大モデルClaudeのために新しい機能であるComputer Useを反復し、AIが人間のようにコンピュータを操作できるようにした。Claude 3.5 Sonnetは、カーソルの移動、ボタンのクリック、テキストの入力など、人間がコンピュータを操作することをシミュレートするコンピュータ制御をサポートする最初のモデルです。
アップルはSiriとChatGPTを統合し、よりスマートなヒューマン・インタラクションを実現することを選んだ。また、アップルがFerret-UIの2つの実装バージョン(それぞれGemma 2 BとLlama 8 Bに基づく)を黙々と発表していることに気づいたネットユーザーもいた。これはアップルが今年5月に発表したAIに携帯電話の画面を理解させる技術だ。
ファーウェイはAIが人間のように携帯電話を操作できるようにするための新しい研究成果を発表し、関連チームは携帯電話制御アーキテクチャを提案した:Lightweight Multi-modal App Control(軽量マルチモーダルアプリケーション制御、略称LiMAC)。
中国ユニコーン企業の智譜AIはすでにAIアシスタントツールAutoGLMをオンラインにしており、手動で操作する必要はなく、ユーザーが携帯電話に向かって話す(指令を出す)ことで、携帯電話の各種アプリを自動的に開き、ネット通販、出前、高速鉄道チケットの予約、さらには微信、現金入り封筒の奪い取り、モーメンツの評価、ノートの整理、攻略、論文のまとめを行うことができる。
中信証券によると、AutoGLMなどの端末AIアシスタント技術はより短い経路の対話形式をもたらし、音声コマンドを受けて複雑な操作を自動的に完了する能力は消費者に極めて便利であり、AI端末の目玉機能となり、消費者のアップグレード・モデルチェンジを誘致することが期待されている。
華泰証券も、AIアシスタントの着地は複数のレベルの産業チャンスをもたらし、その中で、Agent+端末は人間機のインタラクティブな変革を推進することが期待され、端末の販売価格の変化のほか、端末アプリケーションのビジネスモデルにさらに深い影響を与える可能性があると述べた。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|www.LogoMoeny.com

GMT+8, 2024-11-30 08:47 , Processed in 0.099887 second(s), 8 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表