マルチモーダルAIの次のステップは3 Dコンテンツ生成ですか?新しいツールが大ヒットGitHub
梦想飞翔
发表于 2024-3-5 16:39:46
4748
0
0
マルチモーダルコンテンツ生成はAIGCの広い応用空間を示し、3 Dは次のブレークスルーを実現するモデルになることが期待されている。
最近、DUSt 3 RというAIの新しいツールが爆発マイクロソフト傘下のGitHubプラットフォームでは、2枚の画像で2秒で3 D再構築が完了し、追加データを測定する必要はありません。このAIツールはオンラインになって間もなくGitHubのホットランキング2位にランクインした。あるネットユーザーは、2枚の写真を撮ると彼の家の台所が再建され、全体の過程で2秒もかからなかったと実測した。
3 Dモデル生成には通常、MVS推定カメラパラメータが必要であり、3 D空間中で対応する画素を三角測量する。この製品が従来と異なるのは、任意の画像を3 D立体的に再構築するための新しいパラダイムであり、カメラのキャリブレーションや視点の姿勢などの事前情報は必要ありません。これにより、2つ以上の画像を提供する場合の3 Dモデリング再構築を実現することができる。
3 Dモデリングとは、ソフトウェアを使用して3 Dオブジェクトまたは形状の数学的表現を作成するプロセスを指します。3 Dモデリング技術と3 Dモデルは医療、ゲーム、映画、建築、製品設計または仮想現実などの分野に広く応用されている。
AI+3 Dモデリングは、人工知能技術を用いて、高品質な3 Dモデルを自動生成するプロセスである。伝統的な3 Dモデリングには芸術家が多くの時間と精力を費やして手作業で創作する必要があるが、AI生成は機械学習アルゴリズムを訓練することにより、コンピュータが3 Dモデルを自動的に学習し、生成することができ、効率と正確性を大幅に向上させるとともに、全体の制作コストを削減した。
ユーザーはキーワードを入力したり、2 D画像をアップロードしたりするだけで、これらのツールは一定の時間内に比較的初期的な3 Dモデルを直接複数生成することができ、ユーザーが満足すれば、より精度の高い3 Dモデルをさらに生成することができます。
現在の3 Dコンテンツ生成ツールはすでに少なくなく、現在海外ではAI+3 D技術において主に工業シーン探索と非工業シーン探索に分けられている。非工業シーンの応用探索は主にグーグルのDreamFusionと英偉達のMagic 3 Dを代表とし、主にゲーム、元宇宙における3 D資産設計に向けている、産業シーン応用では、PTCのCreoやAutodeskのFushion 360などの派生的な設計ソフトウェアを中心に、派生的な設計能力を提供している。
国内で有名な3 D生成AIモデルには、バイト鼓動研究チームが開発したMVDream、幻方量子化傘下の大モデル企業DeepSeekが開発したDreamCraft 3 D、影眸科技は2016年から人の顔を採取して3 Dモデルを生成する業務を行っている。同社CTOの張啓煊氏によると、その人の顔が3 Dを生成するサービスは、現在国内の3 D生成の中で唯一ゲーム生産端に入っている製品のはずだが……。
ChatGPT代表の文生文から、DALL・E代表の文生図、Sora代表の文生ビデオまで、マルチモーダルはすでに共通認識のAI発展傾向になっている。中泰証券は、テキスト、コード、画像、ビデオに続いて、次のブレークスルーを実現する可能性のあるモダリティ推定率は3 Dであり、「SORAに続く次のステップ:文生3 D」を旗印として鮮明に提案している。未来はデジタル化の持続的な発展に伴い、3 D資産数の急速な増加、3 Dモデリングの自動化生成または新たな発展の風口となっているが、さまざまな大モデルに代表されるAIGC生産能力の賦能3 Dモデリング、文生3 D需要の持続的な増加は、AI賦能3 Dモデリングの急速な発展を促進するだろう。
しかし、AI+3 Dモデリング技術は現在も多くの挑戦に直面している。例えば、3 Dデータと資産の不足、AI訓練の難易度が高い、AIリアルタイムレンダリング技術が限られている、商業化の着地が難しいなどの問題がある。
同機構はさらに、産業視点の提案は文生3 Dモデリング分野の進展に引き続きフォローアップし、標的視点BIM分野は広聯達、盈建科に重点を置いている、CAX分野は中望ソフトウェア、索辰科学技術、浩辰ソフトウェアに重点を置いている、EDA分野では華大九天、概倫電子に重点を置いている。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- 中信証券:グーグルGeminiモデル発表AIはマルチモーダル時代へ
- グーグルGemini、Pikaが交差!マルチモーダル昇進AI熱語算力プレートは再び「楽勝」になるのか?
- オープン予約18分で在庫切れ!代理購入は7万元に値上げ!アップルVision Proの前売りが大ヒット
- アップルVision Proの前売り人気コンテンツエコは変革的なチャンスを迎える
- MR大牛深分解Vision Pro:それは業界の次の10年間の中国メーカーの差を代表している
- ビッグニュース!目が覚めるとまた中国資産が暴騰した!「元宇宙第1株」Robloxが22%以上急落
- 体重が爆発!アップルはOpenAIと提携し、iOS 18にジェネレーションAI機能を導入
- 百度領投生数科学技術加速配置多モード大モデル
- 蔚来:電力交換モデルは固体電池の産業化を加速させ、固体電池は多方面から電力交換体験を向上させることができる
- リンゴの重さはポンド!知名な科学技術暴露者:アップルはこれまで最小のデスクトップパソコンにM 4チップを搭載してAI機能を迎える予定
-
アリババは、26億5000万ドルのドル建て優先無担保手形と170億元の人民元建て優先無担保手形の定価を発表した。ドル債の発行は2024年11月26日に終了する予定です。人民元債券の発行は2024年11月28日に終了する予定だ ...
- SOGO
- 前天 09:05
- 支持
- 反对
- 回复
- 收藏
-
スターバックスが中国事業の株式売却の可能性を検討していることが明らかになった。 11月21日、外国メディアによると、スターバックスは中国事業の株式売却を検討している。関係者によると、スターバックスは中国事 ...
- 献世八宝掌
- 昨天 16:29
- 支持
- 反对
- 回复
- 收藏
-
米東時間11月18日、米株終値は反落し、ダウ平均は3営業日連続で下落した。ナスダック・金龍中国指数は上昇した。米株BAKTは162.37%上昇し、盤中5回の溶断メカニズムをトリガした。 大口商品では、WTI原油価格が上昇 ...
- 就放荡不羁就h
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
【意法半導体CEO:中国市場は非常に重要で華虹と協力を展開】北京時間11月21日、意法半導体(STM.N)は投資家活動の現場で、同社が中国ウェハー代工場の華虹公司(688347.SH)と協力していると発表した。伊仏半導体 ...
- 黄俊琼
- 昨天 14:29
- 支持
- 反对
- 回复
- 收藏