OpenAI, 구글의 새로운 움직임에 도전!빌드 AI를 대폭 업데이트하고 비디오 모델 VEO 2 및 최신 Imagen3 출시

蜜桃成熟时 · 发表于 4 天前

구글 (GOOGL, 주가 196.66달러, 시가 24073억 달러) 의 플래그십 AI 연구실험실 구글 딥마인드는 월요일 인공지능 구동 콘텐츠 생성 도구를 대폭 업그레이드해 Veo 2 동영상 생성 모델과 증강판 Imagen 3 이미지 모델을 출시해 AI 이미지와 동영상 생성에서 Open AI의 선두에 도전했다.구글은 이러한 업데이트가 창의적인 작업 과정을 완전히 변화시켜 동영상과 이미지 창작자에게 더 높은 사실감과 맞춤형 경험을 제공할 수 있을 것이라고 밝혔다.
Veo 2는 다양한 주제와 스타일의 고품질 동영상을 생성할 수 있는 구글의 동영상 생성 도구라고 구글은 설명했다.구글은 블로그에서 이 모델이 인간의 표정과 영화 효과 등 디테일을 포착할 수 있는 사실감 면에서 탁월하다고 밝혔다.향상된 물리학 및 영화학 이해를 통해 사용자는 추적 렌즈와 광각 구도 등 놀라운 콘텐츠를 생성할 수 있습니다.
예를 들어, Veo 2는 영화 촬영 언어에 익숙하며, 사용자가 특정 유형의 스타일을 요구하고, 렌즈를 지정하고, 영화 효과를 제안할 수 있으며, Veo 2는 최대 4K 해상도와 몇 분까지 비디오 길이로 렌더링됩니다.특히 이 해상도는 OpenAI Sora 모델의 4배, 동영상 길이는 6배 이상이다.
그러나 현재 이러한 장점은 여전히 이론적입니다.구글의 실험용 동영상 제작 도구인 비데오FX에서 Veo 2가 생성하는 동영상은 720p 해상도, 8초 길이로 제한된다.(이에 비해 Sora의 최대 출력은 1080p, 20초의 단편이다.)
구글은 동영상 생성 모델이 불필요한 손가락이나 의외의 물체와 같은 불필요한 디테일을'환상화'하는 경우가 많지만 Veo 2는 이 면에서 더 사실적이고 오류를 생성하는 빈도가 낮다고 밝혔다.또한 Veo 2에서 생성된 비디오에는 AI에서 생성된 콘텐츠로 표시할 수 있는 보이지 않는 SynthID 워터마크가 포함되어 있어 오용이나 잘못된 귀속의 위험을 줄일 수 있습니다.
DeepMind 제품 부사장 Eli Collins는 언론에 모델이 점차 규모화 될 준비가됨에 따라 구글은 Vertex AI 개발자 플랫폼을 통해 Veo 2를 제공 할 것이라고 밝혔다.
개발자와 창작자는 현재 구글 랩스 (Google Labs) 를 통해 이 도구에 접근할 수 있으며 2025년까지 유튜브 쇼츠와 같은 플랫폼에 광범위하게 통합될 것으로 예상된다.또한 Imagen 3 모델은 이미지 구도와 디테일의 정확성이 강화되어 사실적인 것부터 추상적인 것까지 다양한 스타일을 지원하여 더욱 풍부한 텍스쳐를 생성하고 사용자의 제시에 더욱 충실하게 응답할 수 있다.
현재 Imagen 3는 구글 랩의 ImageFX 도구를 통해 100 개국 이상에 출시되었으며 전 세계 사용자들이 첨단 기능을 시험 할 수 있습니다.
또한 구글은 Imagen 3와 Gemini의 시각 분석 능력을 결합한 창의적인 도구인 Whisk를 출시했습니다.이미지를 입력하고 상세한 텍스트 설명을 생성하거나 스타일을 재혼합하거나 디지털 인형이나 에나멜 배지와 같은 개인화 된 작품을 디자인 할 수 있습니다.
구글은 Whisk가 Imagen 3 모델과 Gemini의 시각적 이해와 묘사 능력을 결합했다고 소개했다.Gemini 모델은 사용자의 이미지에 대한 자세한 텍스트 설명을 자동으로 생성하여 Imagen 3에 전달합니다.이 프로세스를 통해 사용자는 주제, 장면 및 스타일을 흥미롭고 새로운 방식으로 재혼합할 수 있습니다.
북경시간으로 12월 10일, 구글은 새로운 량자칩 Willow (윌로) 를 연구개발했다고 선포했다.이 계산능력이 아주 강한 칩은 량자계산령역의 30년간의 관건적인 돌파를 실현하여 5분이면 현재 컴퓨터가 10요 (10의 25차방) 년에야 완수할수 있는 임무를 완수할수 있다.연구 성과는 12월 9일 발간된 네이처에 실렸다.
소식이 전해지자 양자정보업계는 환호했고 AI권도 크게 흔들렸다.
Willow의 중대한 돌파는 두 가지 방면에서 나타난다: 첫째, 성능, 즉 컴퓨팅 능력의 대폭적인 상승이다.5분 계산량은 현재 운행 속도가 가장 빠른 컴퓨터 10요 (10의 25제곱) 년에나 할 수 있는 임무와 맞먹는다.10&sup2;해는 우주의 나이 (약 130억 년) 보다 훨씬 높다.5분과 10 & amp;sup2;년, 이 대비는 그 계산속도의 도약이 매우 공포스럽다는것을 알수 있다.
둘째는 강력한 양자 오류 수정 능력이다.Willow가 양자 오류 정정 분야에서 달성한 중대한 진전은 확장 가능한 사각형 그리드를 기반으로 논리적 양자 비트 수 (현재 105개의 양자 비트) 가 증가하지만 오류율은 빠르게 감소하는 것이다.3x3 인코딩 서브비트에서 5x5의 그리드, 7x7의 그리드로 확장되어 확장될 때마다 오류율이 절반으로 줄어듭니다.그리고 Willow는 실시간으로 오류를 수정할 수 있기 때문에 짧은 시간 내에 더 높은 단계의 양자 비트 (예: 1050개) 로 확장할 수 있습니다.
이상의 두 가지 중대한 돌파는 성능 향상보다 오류 수정 능력이 과학자들의 주목을 더 받는다.
양자 칩은 양자 컴퓨터의 핵심이다.윌로우의 연구개발팀은 하트무트 네븐(Hartmut Neven)이 이끄는 구글의 양자 AI 실험실이다.하트무트는 Willow는 대규모, 자체 오류 정정 양자 컴퓨터를 향한 큰 걸음이며, 그것의 오류 정정 능력과 고전을 초월하는 컴퓨팅 능력은 신약 발견을 돕는 것부터 더 효율적인 전기 자동차 풀 설계, 핵융합과 신에너지 대체의 진전을 가속화하는 상업 응용을 제공할 수 있는 시스템에 더 가까워지게 한다고 말했다.
매일경제신문 종합 구글, 정보 공개
면책 성명: 이 글의 내용과 데이터는 참고용으로만 제공되며 투자 건의를 구성하지 않습니다. 사용하기 전에 확인하십시오.이에 따라 위험은 스스로 부담한다.

		自动登录	找回密码
密码			立即注册

OpenAI, 구글의 새로운 움직임에 도전!빌드 AI를 대폭 업데이트하고 비디오 모델 VEO 2 및 최신 Imagen3 출시

相关帖子