マルチモーダルAIの次のステップは3 Dコンテンツ生成ですか?新しいツールが大ヒットGitHub
梦想飞翔
发表于 2024-3-5 16:39:46
4739
0
0
マルチモーダルコンテンツ生成はAIGCの広い応用空間を示し、3 Dは次のブレークスルーを実現するモデルになることが期待されている。
最近、DUSt 3 RというAIの新しいツールが爆発マイクロソフト傘下のGitHubプラットフォームでは、2枚の画像で2秒で3 D再構築が完了し、追加データを測定する必要はありません。このAIツールはオンラインになって間もなくGitHubのホットランキング2位にランクインした。あるネットユーザーは、2枚の写真を撮ると彼の家の台所が再建され、全体の過程で2秒もかからなかったと実測した。
3 Dモデル生成には通常、MVS推定カメラパラメータが必要であり、3 D空間中で対応する画素を三角測量する。この製品が従来と異なるのは、任意の画像を3 D立体的に再構築するための新しいパラダイムであり、カメラのキャリブレーションや視点の姿勢などの事前情報は必要ありません。これにより、2つ以上の画像を提供する場合の3 Dモデリング再構築を実現することができる。
3 Dモデリングとは、ソフトウェアを使用して3 Dオブジェクトまたは形状の数学的表現を作成するプロセスを指します。3 Dモデリング技術と3 Dモデルは医療、ゲーム、映画、建築、製品設計または仮想現実などの分野に広く応用されている。
AI+3 Dモデリングは、人工知能技術を用いて、高品質な3 Dモデルを自動生成するプロセスである。伝統的な3 Dモデリングには芸術家が多くの時間と精力を費やして手作業で創作する必要があるが、AI生成は機械学習アルゴリズムを訓練することにより、コンピュータが3 Dモデルを自動的に学習し、生成することができ、効率と正確性を大幅に向上させるとともに、全体の制作コストを削減した。
ユーザーはキーワードを入力したり、2 D画像をアップロードしたりするだけで、これらのツールは一定の時間内に比較的初期的な3 Dモデルを直接複数生成することができ、ユーザーが満足すれば、より精度の高い3 Dモデルをさらに生成することができます。
現在の3 Dコンテンツ生成ツールはすでに少なくなく、現在海外ではAI+3 D技術において主に工業シーン探索と非工業シーン探索に分けられている。非工業シーンの応用探索は主にグーグルのDreamFusionと英偉達のMagic 3 Dを代表とし、主にゲーム、元宇宙における3 D資産設計に向けている、産業シーン応用では、PTCのCreoやAutodeskのFushion 360などの派生的な設計ソフトウェアを中心に、派生的な設計能力を提供している。
国内で有名な3 D生成AIモデルには、バイト鼓動研究チームが開発したMVDream、幻方量子化傘下の大モデル企業DeepSeekが開発したDreamCraft 3 D、影眸科技は2016年から人の顔を採取して3 Dモデルを生成する業務を行っている。同社CTOの張啓煊氏によると、その人の顔が3 Dを生成するサービスは、現在国内の3 D生成の中で唯一ゲーム生産端に入っている製品のはずだが……。
ChatGPT代表の文生文から、DALL・E代表の文生図、Sora代表の文生ビデオまで、マルチモーダルはすでに共通認識のAI発展傾向になっている。中泰証券は、テキスト、コード、画像、ビデオに続いて、次のブレークスルーを実現する可能性のあるモダリティ推定率は3 Dであり、「SORAに続く次のステップ:文生3 D」を旗印として鮮明に提案している。未来はデジタル化の持続的な発展に伴い、3 D資産数の急速な増加、3 Dモデリングの自動化生成または新たな発展の風口となっているが、さまざまな大モデルに代表されるAIGC生産能力の賦能3 Dモデリング、文生3 D需要の持続的な増加は、AI賦能3 Dモデリングの急速な発展を促進するだろう。
しかし、AI+3 Dモデリング技術は現在も多くの挑戦に直面している。例えば、3 Dデータと資産の不足、AI訓練の難易度が高い、AIリアルタイムレンダリング技術が限られている、商業化の着地が難しいなどの問題がある。
同機構はさらに、産業視点の提案は文生3 Dモデリング分野の進展に引き続きフォローアップし、標的視点BIM分野は広聯達、盈建科に重点を置いている、CAX分野は中望ソフトウェア、索辰科学技術、浩辰ソフトウェアに重点を置いている、EDA分野では華大九天、概倫電子に重点を置いている。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- 中信証券:グーグルGeminiモデル発表AIはマルチモーダル時代へ
- グーグルGemini、Pikaが交差!マルチモーダル昇進AI熱語算力プレートは再び「楽勝」になるのか?
- オープン予約18分で在庫切れ!代理購入は7万元に値上げ!アップルVision Proの前売りが大ヒット
- アップルVision Proの前売り人気コンテンツエコは変革的なチャンスを迎える
- MR大牛深分解Vision Pro:それは業界の次の10年間の中国メーカーの差を代表している
- ビッグニュース!目が覚めるとまた中国資産が暴騰した!「元宇宙第1株」Robloxが22%以上急落
- 体重が爆発!アップルはOpenAIと提携し、iOS 18にジェネレーションAI機能を導入
- 百度領投生数科学技術加速配置多モード大モデル
- 蔚来:電力交換モデルは固体電池の産業化を加速させ、固体電池は多方面から電力交換体験を向上させることができる
- リンゴの重さはポンド!知名な科学技術暴露者:アップルはこれまで最小のデスクトップパソコンにM 4チップを搭載してAI機能を迎える予定
-
アップル(AAPL)は現地時間10月31日、9月28日までの2024年第4四半期の業績を発表し、同四半期の売上高は前年同期比6%増の949億3000万ドル、純利益は同36%減の147億3600万ドルだった。 純利益の下落は主に102億ドル ...
- 亲亲宝宝贝贝贾
- 3 小时前
- 支持
- 反对
- 回复
- 收藏
-
スポーツ競技場では、選手の競争が激しく、競技場の外では、各スポーツブランドの販売競争も同様に焦眉している。 世界的なスポーツ用品大手ナイキがこのほど発表した最新の業績は、利益が共に減少していることを示 ...
- 刘moon
- 前天 17:23
- 支持
- 反对
- 回复
- 收藏
-
10月31日、ピッピー生放送の公式アカウントは、「従業員が生中継間抽選確率を操作している疑いがある」という声明を発表した。最近の「B局アカウント@璞煞(UID:4265321)が内部従業員を自称し、生中継間抽選確率 ...
- joanne941
- 前天 13:29
- 支持
- 反对
- 回复
- 收藏
-
市場調査機関のCounterpoint Researchによると、「アップルインテリジェンス」(Apple Intelligence)の発表が近づき、米国地域でのアップルのiPhone 16シリーズの発売4週間以内の累計販売台数は前世代のiPhoneより ...
- 愿为素心人
- 昨天 10:50
- 支持
- 反对
- 回复
- 收藏