首页 신문 正文

구글이 중점적으로 개발한 Gemeni 모델이 오늘 마침내 공식 모습을 드러냈다는 소문이 돌고 있다.
12월 6일 (현지 시간) 구글 홈페이지는"우리 역사상 가장 크고 가장 강한 AI 모델 Gemini"를 소개하는 글을 올렸다. 세 가지 키트가 포함돼 있다.
Gemini Ultra - 구글이 가장 많고 성능이 가장 강한 모델로 고도로 복잡한 작업에 적합합니다.
Gemini Pro - 다양한 작업을 확장할 수 있는 모델;
Gemini Nano - 효율적인 디바이스 측 작업 모델.
Gemini 시리즈 모델은 다중 모드, 유연성 두 가지 능력을 위주로 한다.공식 홈페이지는 Gemini를'네이티브 멀티모달'(natively multimodal) 모델로 정의했다.Gemini의 출하 설정은"전체 과학 발전"이며, 여러 가지 감각 기관이 모델 내에서 통일적으로 학습하는 것이지, 단독으로 학습하여 다시 결합하는 것이 아니라는 것을 이해할 수 있다. 후자는 GPT 등 모델이 채택한 표준 방법으로,"편과"문제를 초래할 수 있다. 즉 문자나 그림을 더 잘 처리하는 것이다.
이것은 Gemini가 텍스트, 코드, 오디오, 이미지 및 비디오를 포함한 다양한 유형의 정보를 직접 이해할 수 있으며 추가 변환이 필요하지 않으며 다양한 모드의 성능도 더 균형 잡혀 있음을 의미합니다.
공식 홈페이지는 네이티브 다중모태 능력으로 게미니가"더 복잡한 질문에 대답할 수 있다"며"수학과 물리 등 복잡한 학과의 추리를 해석하는 데 특히 뛰어나다"고 소개했다.공식 홈페이지는 MMLU (대규모 멀티태스킹 언어 이해) 의 테스트 결과를 강조했다. MMLU 테스트는 대학 수학, 물리, 경제학, 사회 과학 등 일련의 문제를 포함한 모델의 텍스트와 이미지 처리 능력을 측정하기 위한 것이다.Gemini Ultra는 90.0%의 높은 점수를 받아 처음으로 인간 전문가를 추월했습니다.
특히 Gemini는 32가지 성능 테스트 기준 중 30개가 GPT-4를 앞질렀지만 대부분 격차가 적었다.
유연성 면에서 구글은 더 많은 모델 응용의 선택을 내놓았다.예를 들어 Gemini Nano는 메모리 공간이 제한된 모바일 장치에 가장 가벼운 모델입니다.이 모델은 12월 구글폰 픽셀 8 프로에 처음 내장돼 녹음 자동, 키보드 스마트 답장 두 가지 기능을 지원하며 앞으로 더 많은 기능을 안드로이드폰에 설치해 오프라인으로 운영할 예정이다.산다 피체 구글 CEO는 또 Gemini가 구글 검색, 광고 마케팅, 크롬 브라우저, Duet AI와 같은 더 많은 제품과 서비스에 등장할 것이라고 밝혔다.
"우리는 Gemini가 새로운 영역을 전면적으로 개척한 것을 확실히 보았다."구글 딥마인드 제품 부사장은 최근 전화 회의에서 그러나 큰 모델에 여전히 무시할 수 없는 환각, 편견, 남용 문제가 존재한다는 것을 인정했다.실제 GPT-4를 직시하는 Gemini Ultra 모델은 아직 내부, 외부의 레드팀 보안 테스트를 받고 있으며 내년 초에나 출시될 예정이다.
관심을 가져야 할 것은 곧 Gemini Ultra 모델이 지원하는 대화 로봇 Bard가 가장 큰 업데이트를 맞이할 것이라는 점이다.업데이트된 Bard는 170여 개 국가, 지역에서 서비스를 제공할 계획이지만 EU와 영국은 포함되지 않았다.Bard를 담당하는 Google 부사장은 회사가 현지 규제 기관과"접촉"을 계속하도록 하기 위한 것이라고 밝혔다.
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

oralpapapa 新手上路
  • 粉丝

    0

  • 关注

    0

  • 主题

    4