首页 报纸 正文

「汎用大モデルは計算力で積み上げられ、企業大モデルは業務で飛び出しなければならない」。
7月30日、上海で開催された京東雲峰会で、京東グループ技術委員会主席、京東雲事業部総裁の曹鵬氏がこのように述べた。彼の理解によれば、大きなモデルにとって、データは養分であり、シーンは練兵場である。
過去1年間、大モデルは熱狂を続け、業界は「千模大戦」を経験した。中国信通院の統計によると、現在、世界の基礎的な大模型は1000以上あり、中国の大模型の数は世界の35%を占めている。
ベースモデルの性能は向上しつつあるが、個人ユーザー側では、大きなモデルには本当の意味でのスーパーアプリケーションはまだ現れておらず、むしろ多くの企業側シーンでは、アプリケーションに基づいて徐々に展開されている。
サミットの現場で、京東雲は京東言犀大模型の着地業界の最新実践を展示し、京東雲企業大模型サービス、言犀スマート体プラットフォーム、スマートプログラミングアシスタントJoyCoder、言犀デジタル人3.0など8つの製品を発表した。
京東が提供したデータによると、京東大モデルは現在までに100を超えるシーンに着地し、医療健康、電子商取引の生中継、物流、金融などの異業種分野をカバーし、京東の自家配送員、商店、医師、採掘・販売運営及び研究開発者を含む多くの大モデル応用の支持を得ている。
例えば、医療シーンにサービスを提供する「京医千問」、京東健康スマートアルゴリズム部の責任者によると、現在、内部に4つの異なる体量のモデルが作られている。第二に、14 b、22 bを核心とする中型マスモデルで、いくつかの医療コンサルティングとサービスサポート類の仕事を完成する。最後に80 bを核心とし、複雑な医療意思決定と推理能力に特化した大モデルである。
上述のモデルは私有化配置、さらには一体化配置をサポートしており、これは業界の特性と関係があり、「医療業界は完全に純粋なクラウドのモデルを受け入れることが難しく、このような突破を受け入れる病院は少ない」と上述の責任者は述べた。
それによりますと、京医千問は実際の病院の着地シーンで、分診、事前問診、書留、予約、診察中の付き添い、診察後の健康管理などを含むコンプライアンス状況下で患者サービスを独立して完了することにもっと注目しているということです。
「GPTが出てきた初日、すべての人が考えたのはこの世代の自然な会話能力といわゆる擬人化の能力だった。この角度から見ると、医師の助手になることができるかどうかは、医師の診断ツールになることよりもはるかに価値がある」と上述の担当者は強調した。
メイクシーンでは、これまでの生放送とは異なり、京東内部では現在、デジタル人のメイク試しとデジタル人キャスターの結合を試みている。靴の服のシーンでは、前はデジタル人の生中継、後ろはキャスターの着替えのシーンが表示され、特定の品目属性に基づいた生中継スタイルがデジタル人に移行します。
大模型の発展傾向について、複数の京東技術責任者は一人当たり、大模型はやればやるほど小さくなり、垂域大模型は比較的確定的な方向であり、さらにシーン大模型に細分化することができると述べた。その内在的な論理は、大きなモデルがシーンや業界にフィットするため、あまり大きくすることはできません。
京東探索研究院院長、京東科学技術人工知能業務責任者の何暁冬氏は、データと計算力の制限のため、簡単にモデルの規模を高めると、急速に発展の天井に達する可能性があり、大モデルによる経済効果は自身のコストを支えるのに十分ではなく、持続することが難しいと判断した。
「大モデルは毎年10倍の速度で成長し、パラメータは百億、千億から兆に達するが、商業化が着地し、現在は立ち後れており、中長期的には結局問題になるだろう」と同氏は指摘し、現在も多くのモデルの幻覚率は高く、後続の産業応用に堅実な保障を提供できないと指摘した。
何暁冬氏によると、京東氏はモデルの自己進化の面で初期戦略モデルから出発し、まず初期の選好データセットを構築し、それから事前に訓練された奨励モデルを利用して回答ごとに点数をつけ、得点の高低に基づいて新しい選好データを構築し、これらの新しい選好データはモデルの反復更新を大いに促進する。
モデル推論の面では、現在、大言語モデル推論のコストが上昇している。そのため、京東はエンドツーエンド、低ビット、高精度量子化技術を通じて、モデル構築の時効を高め、モデル出力の正確性とパラメータ量に影響を与えない場合、モデルの体積を下げ、推論性能を向上させる。何暁冬氏によると、現在の技術案ではモデルの現存を70%節約しているという。
具体的には、企業の着地モデルについて、曹鵬氏は3つのポイントが非常に重要だと考えている。まず簡単であり、シーンの多様性と断片化は高い開発コストを支えることができず、必然的に大きなモデルの使用敷居を最小限に抑えなければより多くの応用をカバーすることができない。次に開放であり、開放的なエージェント生態、大モデル生態、クラウド原生生態に基づいて、選択権を顧客に渡す。第三に、データセキュリティとプライバシー保護、AIGCコンテンツコンプライアンス、言語データセキュリティ管理を提供し、企業の大モデルサービスを信頼できるようにすることです。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

SOGO 注册会员
  • 粉丝

    0

  • 关注

    0

  • 主题

    37