找回密码
 立即注册
搜索
热搜: Apple Tesla Amazon
查看: 1318|回复: 0

AI 잠금 해제한 3D 서사 이비비, 구글 한발 앞서

[复制链接]

2

主题

0

回帖

16

积分

新手上路

积分
16
发表于 6 天前 | 显示全部楼层 |阅读模式

AIGC의 3D 코스가 갑자기 떠들썩해졌다.
12월 5일, 구글 딥마인드는 차세대 세계 모델 지니2를 출시했다."한 장의 그림으로 1분 게임 3D 세계를 생성할 수 있다". 네티즌들은"해킹 제국이 왔다"고 놀라워했다.
이틀 전만 해도'AI 대모'리페이페이의 월드랩스는'공간 지능'모델을 공개하고'한 장의 그림이 하나의 3D 세계를 생성한다'고 지원했다.
소라에 이어 세계 모델에 대한 또 하나의 토론 열풍이다.AIGC는 텍스트에서 이미지, 비디오와 상호 작용이 가능한 3D 세계에 이르기까지 전반적으로 큰 도약을 이루었습니다.
산업단에 있어서 창조적설계류 사업과 상호작용식체험워크플로우는 모두 강대한 조력을 맞이했다.월드 모델은 에이전트 훈련, 구신 스마트 훈련, 복잡한 애니메이션 제작, 게임 제작, 물리학 모델링 등 분야에 무한히 다양하고 조종 가능한 3D 환경을 제공할 수 있다.
세계 모델의 진전은 궁극의 AGI (범용 인공지능) 가 한 걸음 더 가까워졌음을 의미한다고 말하는 산업인도 있다.
Google, AGI로의 폭 확대
Genie 2는 구글의 2세대 세계 모델로 이미지 한 장을 지정하면 키보드와 마우스로 입력할 수 있는 조작 가능한 3D 환경을 만들 수 있다.
키보드에 의해 인식되고 지능적인 작업에 응답할 수 있는 이미지의 역할
동일한 시작 프레임에서 다른 동작 궤적을 생성할 수 있습니다.
지니2는 앞뒤 기억이 일치해 주변 장면이 보이지 않을 때도 왜곡되지 않는다.
기특하게도 지니2는 화면에 따라 새로운 장면을 최대 1분까지 실시간으로 생성할 수 있다.
이런 인터페이스는 게임과 공통점이 있다.
"게임은 인공지능 연구 분야에서 핵심적인 역할을 하고 있다. 이들의 황홀한 화질, 독특한 도전 조합과 측정 가능한 진보는 AI 기능을 안전하게 테스트하고 추진하는 이상적인 환경이 되고 있다."구글 측은 "사실 게임은 구글 딥마인드에 줄곧 중요하며 구글이 에이전트를 훈련시키는 중요한 경로이기도 하다"고 털어놓았다.
그러나 구신지능에 대한 훈련은 업계가 한계에 부딪혔다.
충분히 풍부하고 다양한 훈련 환경이야말로 구신지능의 실제 진보를 촉진할 수 있다.21세기 경제보도 기자가 인간형로보트산업인사로부터 알아본데 따르면 현재 일반화능력은 인간형로보트의 큰 통점이다.
지니2는 훈련 병목 현상을 구체적이고 지능적으로 해결하는 데 도움을 줄 것으로 기대된다.
인터렉션 기능에서 Genie 2는 풍선 폭파, 문 열기, 폭약통 사격 등 인터렉션 관계를 모델링할 수 있다.
이것은 다양한 인터렉션 장면을 만드는 것을 훨씬 간단하게 한다.지니2가 빠르게 구축한 다양한 대화형 체험 프로토타입을 활용해 연구원들은 새로운 환경으로 구신 스마트 AI를 빠르게 훈련하고 테스트할 수 있다.
예를 들어, Imagen 3를 사용하여 생성된 다양한 이미지는 Genie 2가 종이 항공기, 드래곤, 호크 또는 낙하산 비행 사이의 차이를 모델링하고 Genie가 서로 다른 객체를 제어할 때의 능력을 테스트하도록 제시한다.
즉, AI 지능체는 세계 모델에서 거의 무한한 훈련 장면과 인터렉션 체계를 얻을 수 있다.
이 연구는 아직 초기 단계이지만 구글 연구진은 Genie 2가 보안 훈련 구신지능의 구조적 문제를 해결하는 효과적인 경로이며, 구신지능의 다음 능력을 잠금 해제하고 AGI로 나아가는 데 필요한 폭과 범용성을 실현할 수 있다고 보고 있다.
리페이페이는 공간 지능 구상을 실현했다
World Labs는 저명한 AI 학자이자 중국계 과학자인 리페이페이의 첫 번째 창업 프로젝트로 2024년 1월에 설립되었으며, 회사가 창립된 지 반년이 되었을 때 평가액은 이미 10억 달러를 넘었다.
이 회사는 3D 세계와 감지, 생성 및 상호 작용할 수있는 대규모 세계 모델을 구축하기 위해 노력하는 우주 스마트 회사입니다. 사용자에게 변수를 조작 할 수있는 가상 3D 공간을 생성하고 사람들이"자신의 3D 세계를 만들 수 있도록"할 계획입니다.World Labs는 그 소프트웨어가 예술가, 디자이너, 개발자 및 엔지니어를 포함한 다양한 종사자들에게 도움이 될 것이라고 지적했다.
12 월 3 일, World Labs는 1.0 버전 작업을 제출했습니다.
하나의 이미지로 3D 세계를 생성할 수 있으며, 사용자는 실질적인 의미에서 모든 이미지를"진입"하고 3D에서 탐색할 수 있습니다.
이 도구는 또한 조작 가능한 슬라이더를 장착하여 아날로그 심도와 아날로그 밀당 줌을 조절하고, 카메라의 위치와 시야 조정, 객체 색상 변경, 스폿라이트 효과 만들기, 자동으로 실행되는 동적 효과 등 인터렉션 방식을 지원하여 시각적 체험과 더욱 강한 조종감을 풍부하게 한다.
Genie 2와 마찬가지로 World Labs의 공간 지능 모델도 3D 세계의 일관성을 보장할 수 있으며 장면이 더 오래 지속되고 일단 생성되면 계속 존재합니다.사용자는 실시간으로 장면을 제어하고 실시간으로 이동할 수 있으며 장면의 세부 사항을 자세히 관찰할 수 있다.
세계 모델은 3D 기하학의 기본 물리 규칙을 따르고 진실감과 깊이감을 겸비하여 내용의 조작성과 일치성을 효과적으로 향상시켰으며 영화, 게임, 시뮬레이터 및 물리 세계의 기타 디지털 표현 형식의 제작 방식을 변화시켰다.
엔비디아의 선임 연구과학자 짐 팬은 GenAI가 점점 더 고차원적인 인간 경험 스냅샷을 만들고 있다고 평가했다. Stable Diffusion은 2D 스냅샷이다.Sora는 2D+ 시간 차원의 스냅샷입니다.World Labs는 3D, 완전 몰입형 스냅샷입니다."
현재 Worldlabs는 대중에게 후보 신청을 개방했으며 일부 창작자는 이미 이 AI 도구를 기존 워크플로우에 통합할 수 있다.
영상 제작 분야에서 AI의 3D 서사 능력은 콘텐츠 창작의 효율과 질을 크게 향상시키고 제작 원가를 낮출 것이다.창작자는 가상 장면과 캐릭터를 더욱 빠르게 생성할 수 있으며, AI가 생성한 3D 세계를 통해 더욱 풍부하고 다양한 이야기 배경을 구축하여 관중들에게 새로운 시각적 체험을 가져다 줄 수 있다.
예를 들어, 촬영 전에 Worldlabs 기술을 이용하여 가상의 촬영 장면을 생성하여 감독과 사진작가가 렌즈와 장면 배치를 더욱 잘 기획하고 촬영 효율과 정확성을 높일 수 있도록 돕는다.
게임 업계에 3D 생성은 게임 개발에 더 많은 가능성을 가져다 줄 것이다.개발자는 AI를 이용해 더욱 사실적이고 섬세한 게임 장면과 캐릭터를 생성해 게임의 몰입감을 높일 수 있다.
교육 분야에서 큰 모델이 생성하는 3D 콘텐츠는 더욱 생동감 있고 직관적인 교육 장면을 만들어 과학, 역사 등 학과의 체험감을 높일 수 있다.
리페이페이는'공간 지능'이 AI 퍼즐의 핵심 일환이라고 생각한다.그는 지난 4월 TED 연설에서 "시각은 통찰력으로, 통찰력은 이해력으로, 이해력은 행동을 움직인다.이 모든 것이 지능을 낳는다"고 말했다.
지니2와 월드랩스가 대표하는 공간지능 분야는 AI 기술 발전의 중요한 새로운 방향이다.이는 2차원 평면에서의 전통적인 AI의 한계를 돌파하고 AI의 감지와 이해 능력을 3차원 공간으로 확장하여 더욱 직관적이고 인터렉션의 본질에 더욱 가까워졌다.
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|www.LogoMoeny.com

GMT+8, 2024-12-12 23:56 , Processed in 0.099813 second(s), 8 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表