OpenAIの「次の重大な突破」初のAIアシスタント製品か、来年1月に発表されるヒューマン・インタラクションの変革は到来したのか。
二八一霉
发表于 昨天 11:06
1261
0
0
メディアの報道によると、OpenAIはコードの作成、旅行の予約、電子商取引の自動買い物など、さまざまな複雑な操作を自動的に実行できる「Operator」という新しいAIアシスタント製品を発売する準備をしている。内部従業員の暴露によると、OpenAIリーダー層は2025年1月に同製品を発表する予定で、まず研究プレビュー版と開発ツールとして発売され、その際に開発者のためにAPIインタフェースを開放する。
記事によると、OpenAIはスマートボディに関するいくつかの研究プロジェクトを行ってきたという。ある人は、最も完成に近いのはWebブラウザでタスクを実行するための汎用ツールだと述べています。
AIアシスタント(AI Agent)は環境を感知し、意思決定と実行動作を行うことができるインテリジェントなエンティティであり、独立した思考、ツールを呼び出して所与の目標を段階的に達成する能力を備えており、C端に個性的な応用を提供することができるだけでなく、B端にコスト削減の効果的な方案を提供することもできる。一般ユーザーにとって、AIアシスタントの最も核心的な機能はAIが携帯電話を自律的に操作し、複雑な推理任務を支援することである。
OpenAIのアルトマン最高経営責任者はすでに退場の意思を明らかにしている。数週間前、Redditの「私に何でも聞いて」(Ask Me Anything)フォーラムで、「私たちはますます良いモデルを持っているが、次の大きな突破はAIアシスタントだと思う」と述べた。先月の同社の年次開発日に先立ったOpenAI記者会見で、同社のケビン・ワイル最高製品責任者は「2025年はエージェントシステムが最終的に主流に入る年になると思う」と述べた。
OpenAIの視点に立つと、ビジネス化の過程でますます大きな圧力に直面しており、ChatGPTの漸進的な改善はユーザーにより高い価格を支払うことを引き付けることができない可能性がある。幹部はAI開発への巨額の投資が価値があることを証明するために、画期的な製品を必要としている。
現在、OpenAIは多機能連携AI AgentであるSwarmをオープンソースしており、より効率的にタスクを遂行するために複数のエージェント連携を作成することができます。そのGPT o 1モデルは推論能力を強化し、複雑な問題の解決とユーザー相互作用の自然性の面で顕著な進歩を遂げ、AIエージェントシーンにもさらに適用できるようにした。
AIアシスタントはAGIへのコア基盤と見なされており、ハードウェアメーカーが必ずAIと呼ぶ時代には、AIアシスタントは端末のインテリジェント化の突破口となるかもしれない。甬興証券によると、AIエージェントはモバイル相互接続の新たな入り口を掌握するか、流量分配構造はAIエージェントエージェントの知能体が比較的強い相互作用性と利便性を備えているため、あるいは元の同じ端末の異なるApp間の天然障壁を打ち破ることができることが期待されている。
「科創板日報」の不完全な整理によると、国内外のヘッドメーカーがAIアシスタント製品の発売を争っている--
マイクロソフトは最近、パーソナルコンピュータを操作するためにユーザーが個人的なスマートボディを作成するのを支援するAIツールOmniParserを低調にオープンした。マイクロソフトは10月22日、Dynamics 365に10個の自主AIエージェントを統合し、OpenAI最新モデルo 1をサポートし、自主学習能力を備え、プラットフォーム間の複雑な業務を自動的に実行できる、9月、マイクロソフトはWindowsエージェント・アリーナというベンチマーク・フレームワークを発表し、同じくAIアシスタント開発のカテゴリーに属している。
The Informationによると、グーグルは12月に大規模なアクションモデル「Project Jarvis」をプレビューする予定で、このプロジェクトはユーザーが「研究の収集、製品の購入、フライトの予約」などのタスクを実行するのを支援する。
10月22日、Anthropicは大モデルClaudeのために新しい機能であるComputer Useを反復し、AIが人間のようにコンピュータを操作できるようにした。Claude 3.5 Sonnetは、カーソルの移動、ボタンのクリック、テキストの入力など、人間がコンピュータを操作することをシミュレートするコンピュータ制御をサポートする最初のモデルです。
アップルはSiriとChatGPTを統合し、よりスマートなヒューマン・インタラクションを実現することを選んだ。また、アップルがFerret-UIの2つの実装バージョン(それぞれGemma 2 BとLlama 8 Bに基づく)を黙々と発表していることに気づいたネットユーザーもいた。これはアップルが今年5月に発表したAIに携帯電話の画面を理解させる技術だ。
ファーウェイはAIが人間のように携帯電話を操作できるようにするための新しい研究成果を発表し、関連チームは携帯電話制御アーキテクチャを提案した:Lightweight Multi-modal App Control(軽量マルチモーダルアプリケーション制御、略称LiMAC)。
中国ユニコーン企業の智譜AIはすでにAIアシスタントツールAutoGLMをオンラインにしており、手動で操作する必要はなく、ユーザーが携帯電話に向かって話す(指令を出す)ことで、携帯電話の各種アプリを自動的に開き、ネット通販、出前、高速鉄道チケットの予約、さらには微信、現金入り封筒の奪い取り、モーメンツの評価、ノートの整理、攻略、論文のまとめを行うことができる。
中信証券によると、AutoGLMなどの端末AIアシスタント技術はより短い経路の対話形式をもたらし、音声コマンドを受けて複雑な操作を自動的に完了する能力は消費者に極めて便利であり、AI端末の目玉機能となり、消費者のアップグレード・モデルチェンジを誘致することが期待されている。
華泰証券も、AIアシスタントの着地は複数のレベルの産業チャンスをもたらし、その中で、Agent+端末は人間機のインタラクティブな変革を推進することが期待され、端末の販売価格の変化のほか、端末アプリケーションのビジネスモデルにさらに深い影響を与える可能性があると述べた。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
-
南方財経は11月12日、百済神州が2024年第3四半期の報告書を発表し、同社の第3四半期の営業収入は71.39億元で、前年同期比26.9%増加した。上場企業の株主に帰属する純利益は-8.09億元で、主に前年同期に百時米施貴宝 ...
- 1900_后
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
北京商報(何倩記者)は11月14日、「チャトンと野菜を買ってサウジに出航した」との情報に対し、チャトンと野菜を買った関係責任者は北京商報記者に対し、関連業務はまだ初歩的な模索にすぎず、しばらく詳細な情報 ...
- 柔柔树呆熊呆j
- 昨天 16:39
- 支持
- 反对
- 回复
- 收藏
-
黄仁勲が最新発表! 11月13日、英偉達の黄仁勲CEOは英偉達日本サミットで、日本最大のAI工場を含むソフトバンクと協力して日本にAIインフラを構築すると発表した。ソフトバンクの孫正義元会長兼社長は、「ソフトバ ...
- tomy123123
- 前天 14:57
- 支持
- 反对
- 回复
- 收藏
-
【世界市場】1、ダウは0.11%、スタンダードは0.02%、ナノ指は0.26%下落した。2、大型科学技術株の多くが上昇し、アマゾンは2%超上昇し、株価は過去最高を記録した。3、国際金価格は4日連続で下落し、2600ドルの関門 ...
- 就放荡不羁就h
- 昨天 14:54
- 支持
- 反对
- 回复
- 收藏