首页 报纸 正文

OpenAIによって巻き起こされたこの大モデルの波はすでに2年近くも熱くなっており、関連技術はかつてない速度で反復と革新を行い、大企業から創業者、ベンチャー投資まで、生成式AI時代の大モデルに基づくスーパーアプリケーションを次々と探している。
しかし客観的には、業界が期待するスーパーアプリケーションは今のところ現れていない。過去24カ月、このような世界的な大モデルの熱狂は、新しい技術革命なのか、それとも新しいバブルなのか、疑問に思う人もいるだろう。
今日の百度世界大会で、百度の李彦宏会長は1枚の図でこの質問に答えた。講演では、業界で話題のAIバブルについて、彼の後ろの画面には文心大モデルの1日平均呼び出し量の変化グラフが表示され、曲線は急峻な成長を示した。データによると、百度文心大モデルの1日の転用量は15億に達し、半年間の成長率は7.5倍に達した。
「過去18カ月の間に、中国の大モデル応用爆発はこの図やこの曲線で表すことができた」と李彦宏氏は述べた。6カ月前の日の呼び出し量データが2億だった時、自分は百度幹部と大モデルの将来について話し合った時、「もし私たちの大モデル型の日平均API呼び出し量が1年以内に10倍になれば、私はそれになると思う。今はわずか半年で、私たちはこの数字に近い」と言った。
李彦宏氏は同日、検索が強化された文生図技術(iRAG)とコードレスツール「秒」の2つのAI技術を発表した。前者は主に大モデルの画像生成上の幻覚問題を解決し、実用性を高めるために用いられる、後者は業界の敷居を下げ、一般ユーザーにプログラマの能力を持たせる。
検索強化はすでに大モデル業界の共通認識となっており、過去24カ月、李彦宏氏は、業界にとって最大の変化は大モデルが幻覚を基本的に解消し、質問に答える正確性が大幅に向上し、AIが「生真面目なでたらめ」から、利用可能になり、信頼されるようになったと考えている。
今年初め、中国語インターネット全体がソラのために地団駄を踏んでいた時、百度は画像生成の幻覚問題を解決することにしたと回想している。百度が今日発表した検索強化された文生図技術は、百度検索の画像資源と基礎モデル能力を結合し、さまざまな超リアルな画像を生成することができる。
現場では、「フォルクスワーゲンが車をチャーターして万里の長城を飛び越える写真を描き、写実的なスタイルを描いた」とヒントとして、生成された画像を拡大してみると、車種も車標も間違いなく変形し、万里の長城の背景との融合度が高い。
しかし、第一財経記者は、この写実的な画像はある程度「機械の匂い」を消したとしか言いようがなく、「一目で偽物」のAI画像よりも写実的だが、「偽物で本物を乱す」ことができるほどのリアルな効果はまだ得られていないことを発見した。
しかし、AIによる画像生成技術の進歩と可用性の向上に伴い、応用空間も開かれている。「例えばブランドの宣伝シーンでは、以前はこのようなポスターのセットを撮るのに120万、さらには数十万円かかりましたが、今はこのような創作のコストは0に近い」と李彦宏氏は言う。
「iRAGのビジネス価値は、幻覚がなく、超リアルで、コストがなく、そして、何と言ってもいいことに表れている」と李彦宏は続けて冗談を言った。「考えてみて、大衆のポスターがトヨタに似ているとしたら、大変だ」。
これらの基礎モデルの能力が整っていることを前提に、業界はAI応用の爆発を迎えると予想している。李彦宏は2つのAI応用方向:産業応用と知能体を再提案している。
大モデルの産業応用をめぐって、李彦宏氏は、過去1年半ほど、大モデルと金融、エネルギー、教育、求人、公共サービスなど多くの分野のシーンを結合した後、コスト削減と効率化の面で成果を上げたと述べた。百勝との協力を例に、現在のAIのカスタマーサービス応用とソリューションは、百勝の全線の業務をカバーしており、大モデルの1日の呼び出し量のピークは数百万に達し、カスタマーサービスロボットの「問題解決率」は90%向上した。
スマートボディを作るのは、PC時代にウェブサイトを作ったり、モバイル時代に自メディアアカウントを作ったりするのと似ています。異なる点は、エージェントがより人間的でスマートであることであり、李彦宏氏は、エージェントがAIネイティブ時代、コンテンツ、情報、サービスの新しいキャリアになる可能性があると推測している。
例えば、百度で「教育指導」のキーワードを検索すると、検索結果ページにこれらの数字の人が表示されます。これらのデジタル人はより自然で、適切なタイミングで停止し、ネットユーザーの現場からの質問に返信することができます。「今日のデジタル人の生放送は、多くの場合、転化率が実写を超えている」。
また、百度文庫と百度ネットディスクが共同で構築したツール系スマートボディ「フリーキャンバス」は、ユーザーが「キャンバス」のようなインタフェース上で文書や音声ビデオなどのリッチメディア素材を自由にドラッグし、マルチモーダルコンテンツを生成できるようにしている。法律知能体「法行宝」は、ユーザーの1660万件の法律問題に答え、専門弁護士のように答えられるだけでなく、法律賠償額を計算し、法律文書を作成し、適格な人間弁護士を推薦することができる。
李彦宏氏によると、スマートボディは敷居が低く、天井が高く、誰もが手に入れることができ、複雑で強力な応用をすることができる。「エージェントはAI応用の最も主流の形態であり、間もなくその爆発点を迎える」。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

SOHU 注册会员
  • 粉丝

    0

  • 关注

    0

  • 主题

    22