首页 报纸 正文

マルチモーダルコンテンツ生成はAIGCの広い応用空間を示し、3 Dは次のブレークスルーを実現するモデルになることが期待されている。
最近、DUSt 3 RというAIの新しいツールが爆発マイクロソフト傘下のGitHubプラットフォームでは、2枚の画像で2秒で3 D再構築が完了し、追加データを測定する必要はありません。このAIツールはオンラインになって間もなくGitHubのホットランキング2位にランクインした。あるネットユーザーは、2枚の写真を撮ると彼の家の台所が再建され、全体の過程で2秒もかからなかったと実測した。
3 Dモデル生成には通常、MVS推定カメラパラメータが必要であり、3 D空間中で対応する画素を三角測量する。この製品が従来と異なるのは、任意の画像を3 D立体的に再構築するための新しいパラダイムであり、カメラのキャリブレーションや視点の姿勢などの事前情報は必要ありません。これにより、2つ以上の画像を提供する場合の3 Dモデリング再構築を実現することができる。
3 Dモデリングとは、ソフトウェアを使用して3 Dオブジェクトまたは形状の数学的表現を作成するプロセスを指します。3 Dモデリング技術と3 Dモデルは医療、ゲーム、映画、建築、製品設計または仮想現実などの分野に広く応用されている。
AI+3 Dモデリングは、人工知能技術を用いて、高品質な3 Dモデルを自動生成するプロセスである。伝統的な3 Dモデリングには芸術家が多くの時間と精力を費やして手作業で創作する必要があるが、AI生成は機械学習アルゴリズムを訓練することにより、コンピュータが3 Dモデルを自動的に学習し、生成することができ、効率と正確性を大幅に向上させるとともに、全体の制作コストを削減した。
ユーザーはキーワードを入力したり、2 D画像をアップロードしたりするだけで、これらのツールは一定の時間内に比較的初期的な3 Dモデルを直接複数生成することができ、ユーザーが満足すれば、より精度の高い3 Dモデルをさらに生成することができます。
現在の3 Dコンテンツ生成ツールはすでに少なくなく、現在海外ではAI+3 D技術において主に工業シーン探索と非工業シーン探索に分けられている。非工業シーンの応用探索は主にグーグルのDreamFusionと英偉達のMagic 3 Dを代表とし、主にゲーム、元宇宙における3 D資産設計に向けている、産業シーン応用では、PTCのCreoやAutodeskのFushion 360などの派生的な設計ソフトウェアを中心に、派生的な設計能力を提供している。
国内で有名な3 D生成AIモデルには、バイト鼓動研究チームが開発したMVDream、幻方量子化傘下の大モデル企業DeepSeekが開発したDreamCraft 3 D、影眸科技は2016年から人の顔を採取して3 Dモデルを生成する業務を行っている。同社CTOの張啓煊氏によると、その人の顔が3 Dを生成するサービスは、現在国内の3 D生成の中で唯一ゲーム生産端に入っている製品のはずだが……。
ChatGPT代表の文生文から、DALL・E代表の文生図、Sora代表の文生ビデオまで、マルチモーダルはすでに共通認識のAI発展傾向になっている。中泰証券は、テキスト、コード、画像、ビデオに続いて、次のブレークスルーを実現する可能性のあるモダリティ推定率は3 Dであり、「SORAに続く次のステップ:文生3 D」を旗印として鮮明に提案している。未来はデジタル化の持続的な発展に伴い、3 D資産数の急速な増加、3 Dモデリングの自動化生成または新たな発展の風口となっているが、さまざまな大モデルに代表されるAIGC生産能力の賦能3 Dモデリング、文生3 D需要の持続的な増加は、AI賦能3 Dモデリングの急速な発展を促進するだろう。
しかし、AI+3 Dモデリング技術は現在も多くの挑戦に直面している。例えば、3 Dデータと資産の不足、AI訓練の難易度が高い、AIリアルタイムレンダリング技術が限られている、商業化の着地が難しいなどの問題がある。
同機構はさらに、産業視点の提案は文生3 Dモデリング分野の進展に引き続きフォローアップし、標的視点BIM分野は広聯達、盈建科に重点を置いている、CAX分野は中望ソフトウェア、索辰科学技術、浩辰ソフトウェアに重点を置いている、EDA分野では華大九天、概倫電子に重点を置いている。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

梦想飞翔 新手上路
  • 粉丝

    0

  • 关注

    0

  • 主题

    0