首页 신문 正文

12월 7일발 재련합뉴스: 최근 미국의 과학기술거두인 구글은 규모가 가장 크고 기능이 가장 강대하다고 인정하는 AI 지능모델 Gemini를 출시한다고 선포했다.
이번에 구글이 발표한 Gemini 모델은 멀티모드를 구현할 수 있어 성능이 대폭 향상됐다. Gemini는 동영상, 오디오, 텍스트 등 다양한 콘텐츠 형태의 정보를 처리할 수 있는 Transformer decoder를 기반으로 구축된 멀티모드 모델이다.최신 Gemini 모델은 이전 기술과 비교하여 더 복잡한 추리를 할 수 있고 더 미세한 정보를 이해할 수 있습니다.그것은 정보를 읽고 필터링하고 이해함으로써 수십만 건의 문서에서 요점을 추출 할 수 있으며 과학에서 금융에 이르기까지 많은 분야에서 새로운 돌파구를 마련하는 데 도움이 될 것입니다.
Gemini 모델은 체량 크기에 따라 Gemini Ultra, Gemini Pro, Gemini Nano 등 세 가지 버전으로 나눌 수 있으며 모두 컨텍스트 32K 이해를 지원합니다.
1) Ultra 버전은 가장 강력한 버전으로 해당 TPU 인프라에서 최고의 효율을 보여주며 여러 테스트에서 Ultra 버전은 GPT4V보다 성능이 뛰어납니다.
2) Pro 버전은 성가비 최적화 버전으로 추리, 다중모드 등 방면에서도 비교적 강한 능력을 가지고 있으며, Pro 버전은 양호한 확장성을 가지고 있어 몇 주 내에 사전 훈련을 완료할 수 있으며, 여러 테스트에서 GPT4V에 버금가는 PaLM2, Claude2, LLAMA2, GPT3.5 등 주류 대형 모델보다 강하다;
3) Nano: 다른 모델을 증류하여 얻은 4비트 모델로 1.8B와 3.25B 두 버전으로 각각 저메모리와 고메모리 장치를 대상으로 로컬 배치를 지원한다
Gemini 모델은 Google 및 전 세계에서 가장 먼저 출시 된 다중 모드 모델로서 클라우드 및 에지 테스트에서 작동합니다.관련 테스트 데이터 표면에 따르면 Gemini Ultra는 MMLU (대규모 멀티태스킹 언어 이해) 면에서 인간 전문가의 모델보다 우수하며 수평 대비로 볼 때 여러 임무 성능이 GPT-4를 능가한다.
민생증권은 50개가 넘는 벤치마크에서 제미니 모델 시리즈를 평가함으로써 모델 규모가 증가함에 따라 제미니 모델 패밀리는 추리, 수학/과학, 긴 텍스트에서 지속적으로 품질을 향상시켰다고 밝혔다.Gemini Ultra는 6가지 기능 중 가장 우수한 모델입니다.Gemini Pro는 Gemini 모델 제품군에서 두 번째로 큰 모델로서 성능에서도 매우 경쟁력이 있으며 서비스를 제공할 때 더욱 효율적입니다.
민생증권은 Gemini 훈련 과정도 인프라, 알고리즘, 데이터 세트를 혁신할 수 있다고 지적했다.
인프라 측면: Gemini는 Google TPUV5e 및 TPUV4에 의해 훈련되었으며 4096 개의 TPUV4 각 칩을 전용 광학 스위치에 연결하는 등 훈련 과정에서 엔지니어링 혁신을 보여주었습니다. 약 10 초 동안 4x4x4 칩 큐브를 임의의 3D 루프 토폴로지의 슈퍼 노드로 동적으로 재구성할 수 있습니다. Gemini Ultra 및 열 유지 보수 등의 기능에 대한 맞춤형 배포입니다.Ultra 버전에 필요한 고액의 영화 간 상호 연결 속도에 대해 구글은 OCS 광 교환 등 여러 특허 기술을 활용했으며 최종 속도는 아직 제시하지 않았다.
알고리즘 측면: 단일 제어 알고리즘, XLA 컴파일러 등의 기술을 사용하여 훈련 과정을 최적화하고 SDC 등의 문제를 예방함으로써 안정적인 훈련을 실현합니다.
데이터 세트 측면: 분사 기술을 통해 Gemini 훈련 및 추론 속도를 향상시키고 일련의 필터링 방법을 통해 훈련에 사용되는 데이터의 고품질을 보장합니다.
이번 구글의 최신 버전의 컴퓨팅 칩 TPU v5p가 동시에 발표되었다. TPU v5p는 이전 TPU v4 버전의 개선이다. TPU v4에 비해 TPU v5p의 부동 소수점 연산 성능은 두 배 향상되었다. TPU v4보다 큰 언어 모델을 훈련하는 속도는 2.8배 빠르다.중신증권은 다중모드 Gemini 모델의 정식 발표는 한편으로는 응용 장면의 확장을 넓힐 수 있고, 다른 한편으로는 계산력 수요의 지속적인 업그레이드를 가져올 수 있다고 주장했다.민생증권은 후속 AI 산업의 전망을 지속적으로 긍정적으로 보면서 후속 GPT-5 등 모델의 발표도 더 많은 촉매를 가져올 것으로 보고 있다.
중신증권은 현재 검색 장면에서 Gemini는 약 40% 의 지연을 줄일 수 있다고 밝혔다.전체 산업에 있어서 구글의 제품화, 상업화의 추진도 업계 전체의 변화를 가져올 것이며, 동시에 GPT-5 등 모델의 출시와 함께 1) 다중모드모델이 가져오는 계산력 수요의 증가 및2) 점점 더 많은 AI 장면과 제품의 출현.
Gemini의 발표는 다중모드 모델에 대한 더 많은 기대를 가져올 것이며, 산업에 있어서 다중모드 재료는 계산력 수요의 향상을 이끌 것이다;중장기적으로 볼 때, 다중 모드 모델의 업그레이드는 관련 제품의 사용 장면을 풍부하게 할 것으로 예상되며, 하드웨어 업그레이드, 알고리즘 최적화로 인한 비용 최적화를 중첩하여 2C 제품의 진전이 기대된다.
중신증권은 이번 생성식 AI 물결이 과학기술 산업에 미치는 긴 주기의 영향과 변화를 지속적으로 긍정적으로 보고 계산력, 알고리즘, 데이터, 응용 등 단계의 선두 제조업체에 계속 관심을 기울이고 있다고 밝혔다.
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

真不是我干的的 注册会员
  • 粉丝

    0

  • 关注

    0

  • 主题

    37