Pika融資、快手上線可霊アップルのAI製品はなぜ「冷かまどを焼く」のか。
虚空一粒沙2017
发表于 2024-6-11 19:29:06
1388
0
0
アップル(AAPL.US)WWDC開発者大会でApple IntelligenceというAI製品が発売されたが、同日の株価終値は1.91%下落した。興味深いことに、6月11日のWindデータのソラ指数(8841756.WI)は1.55%上昇した。
なぜこのような違いがあるのでしょうか。
アップルは現在のブームを避けるビデオ大モデルを選び、発売されたAI関連アップデートは文字分野に重点を置いているが、国内の概念株の上昇幅は最近の文生ビデオ大モデルブームと密接に関連している。海外ではスターAIビデオ生成会社のPikaが新たな融資を完了し、総額8000万ドルのBラウンド融資を完了すると、会社の推定値は4億7000万ドルを超える。国内では快手(1024.HK)のような「可霊」動画生成大モデルが正式にオンライン化され、Soraと似た技術路線が採用されている。
複数の業界関係者から見ると、アップルはビデオ分野の統合ではなくAI文字に焦点を当てており、コストや実用性などの面で考慮していることが多い。
アップルはソラの「戦局」を避ける
アップルが発売した大言語内蔵モデルは、iPhone、iPad、Macを理解して言語と画像を生成することができる。SiriはChatGPTにアクセスすることで、意味検索機能を持ち、写真、カレンダー、ファイル、メールなどのコンテンツをインテリジェントに検索することができ、またほとんどのChatGPTを使用する機能を登録免除することができる。
天風国際証券アナリストの郭明錤氏は、アップルが新たに発表したApple Intelligenceスイートは生態統合とインタフェース設計の優位性を示し、ユーザーには実用的だが、投資家には花を添えるだけで、後者はオリジナルで使わなければならない機能を見ることを期待していると簡評した。
壁面知能首席研究員の韓旭氏は記者団に対し、アップルはオペレーティングシステムへのアクセスの観点から、主にAIを必要として人の意図を理解し、システムレベルのインタフェースを呼び出す必要があり、これらの需要はソラの出発点と完全に一致していないが、多モード入力テキスト出力の大モデルと比較的一致していると述べた。Soraのような画像やビデオを生成するモデルは、現在ではソフトウェア、特に視覚処理ソフトウェアと結合したほうが適切です。
なぜアップルはソラの「戦局」に加わらなかったのか。
あるAIGCビデオアプリケーションメーカーの関係者は記者に対し、製品の考え方と経営の観点から言えば、アップルは相対的に成熟しており、可視性よりも優れた分野に投入されるだけだと述べた。携帯電話のハードウェア相互作用の面では、文字の使用シーンが多く、研究開発への投入から実際の推理コストの面では、アップルの現在の技術蓄積にとっても相対的に性価格比が高い。
別の業界技術者によると、今日のLLMサービス(大規模言語モデルサービス)は文字分野で基本的に保本を実現しており、文生図分野は必ずしもそうではなく、文生ビデオ分野は必ず赤字になるという。これも今回のアップルWWDC大会がしばらくビデオAIGCの能力を統合していない重要な原因である。
アップルの動きに対し、国内の大モデルコースは現在、ビデオ分野に大きな期待を寄せている。今年4月、清華大学人工知能研究院の副院長、生数科学技術連合創始者で首席科学者の朱軍教授は清華大学と生数科学技術を代表して、中国初のビデオ大模型Viduを発表した。
記者はソラ代表の動画文案をヒントワードとして、快手の「可霊」を入力し、生成動画の対比を行い、「東京ストリートガールウォーク」を例に挙げた。当時ソラ動画には女性が歩く過程で足が変形し、足が交差して転位する際に錯乱し、右足が2回連続で前方を歩くなどの誤りがあった。快手の「可霊」にも同様の問題がある。
天風証券は、快手3 D VAE+DiTアーキテクチャの計算力、モデル、データ品質の向上はすでに商用を実現できる結果を示しており、同時に時間長、比例のカスタマイズは生成素材の可用性を大幅に強化していると考えている。いくつかの複雑な意味理解ではSoraに劣るが、やや簡単なシーンでは差は大きくない。
マルチモーダルによる中国大モデルのサーキット機会
優れたビデオ生成モデルには、モデル設計、データ保障、計算効率、モデル能力の拡張という4つのコア要素を考慮する必要があります。
Soraの存在する未熟な点について、OpenAIは、Soraは複雑なシーンの物理原理を正確にシミュレーションすることが困難である可能性があり、因果関係を理解できない可能性があり、提示された空間の詳細を混同する可能性があり、特定のカメラの軌跡に従うなど、時間の経過とともに発生したイベントを正確に記述することが困難である可能性があると述べていた。
しかし、これはもっと普遍的な問題のようだ。愛詩科学技術の創始者である王長虎氏はこれまで、現在のビデオ大モデルはビデオデータから直接物理知識を学習しているが、実際のビデオには多くの情報が含まれており、それぞれの物理法則を正確に学習するのは難しいと述べてきた。モデルに視覚画面を入力すると同時に、人手、動物のしっぽなどの3 Dモデリング情報を制約として単独で加えることで、大モデル学習を支援し、効果を最適化することができる。
可霊大モデルは原生文生ビデオ技術路線を採用し、画像生成+タイミングモジュールの組み合わせを代替した。現在、暗黙空間符号化/復号化において、主流のビデオ生成モデルは通常Stable Diffusionの2 DVAEを用いて空間圧縮を行うが、これはビデオにとって明らかな情報冗長性が存在する。そこで、快手大モデルチームは3 D VAEネットワークを自己研究し、訓練性能と効果のバランスを探ろうとした。また、タイミング情報モデリングにおいて、快手大モデルチームは、時空モデリングモジュールとして全注意メカニズム(3 D Attention)を設計した。
生数科学技術の唐家渝CEOは、多モード大モデルの研究はまだ初期段階にあり、技術の成熟度はまだ高くないと述べた。これはホットな言語モデルとは異なり、海外では一時代をリードしている。そのため、唐家渝は言語モデルで「巻く」よりも、多モードが国内チームが大モデルコースを占有する重要な機会だと考えている。この点は啓明創投パートナーの周志峰氏と同じ点があり、現在の大モデルは従来の純言語モデルから多モードの探索に向かっていると考えている。
北京智源人工知能研究院の林詠華副院長兼総技師は第一財経記者に対し、中国が多モード分野でカーブして追い越す可能性はあるが、多モードモデルの成功要素は依然として計算力、アルゴリズム、データであると述べた。現在のアルゴリズムの面では、中米チームの間の違いはそれほど大きくなく、業界にも計算力問題を解決する方法があるが、大量の高品質データを取得するには、依然として難しい。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- 官宣!OpenAIが66億ドルの融資を独占最新推定値はゴールドマン・サックスの時価総額を上回る
- 信也科技パキスタン業務プラットフォームが正式にオンラインに
- 商品差異率は70%に達する見込みで、年内には美団上の24 Hスーパー800店を超える
- アップルのAIはいつ国内でオンラインになりますか。クックが応答!
- 中証A 500場外基金の販売開始京東金融オンライン専用区はすでに予約を開始している
- 京東七鮮の「スーパーブレーク」による消費ブーム72時間の成約ユーザー数、オンライン注文数は前年同期比3桁増
- 再鼎医薬は784万株の預託株式を発売する予定で、融資額は2億3000万ドルを超えない見通しだ
- フォード・ムスタングのレンタル事業は12月に広深でオンライン化される
- アリ再啓融資計画:優先無担保バイナリ手形を発行する予定
- 深さ|再鼎医薬融資中毒、累計損失20億ドル超
-
アリババは、26億5000万ドルのドル建て優先無担保手形と170億元の人民元建て優先無担保手形の定価を発表した。ドル債の発行は2024年11月26日に終了する予定です。人民元債券の発行は2024年11月28日に終了する予定だ ...
- SOGO
- 前天 09:05
- 支持
- 反对
- 回复
- 收藏
-
スターバックスが中国事業の株式売却の可能性を検討していることが明らかになった。 11月21日、外国メディアによると、スターバックスは中国事業の株式売却を検討している。関係者によると、スターバックスは中国事 ...
- 献世八宝掌
- 昨天 16:29
- 支持
- 反对
- 回复
- 收藏
-
【意法半導体CEO:中国市場は非常に重要で華虹と協力を展開】北京時間11月21日、意法半導体(STM.N)は投資家活動の現場で、同社が中国ウェハー代工場の華虹公司(688347.SH)と協力していると発表した。伊仏半導体 ...
- 黄俊琼
- 昨天 14:29
- 支持
- 反对
- 回复
- 收藏
-
【ナスダック中国金龍指数は1%下落した。人気の中概株の多くは下落した】現地時間11月21日、ナスダック中国金龍指数は1%下落し、人気の中概株の多くは下落し、必死に10%超下落し、愛奇芸は7%超下落し、百度は6%近く ...
- 比尔992
- 4 小时前
- 支持
- 反对
- 回复
- 收藏