"오픈 소스"가 아닌 Gemma를 개방하는 구글은 왜 큰 모델 경쟁 전략을 전환합니까?
明绍宗朱聿键鼻
发表于 2024-2-22 16:19:09
239
0
0
미국의 거대 기술 기업인 구글은 대언어 모델 분야에서 OpenAI와 Meta를 지속적으로 공격하고 있다.
2월 21일 저녁, 구글은 차세대 무료 상업용 대언어 모델인 젬마를 전 세계에서 개방하여 사용한다고 발표했다.이 모델은 구글이 자체'최첨단 개방형 모델'로 보고 있다.
이것은 이 회사가 AI 대형 모델을 개방하는 분야에서 한 큰 움직임이다.Tris Warkentin 구글 DeepMind 제품 관리 디렉터는"오픈 모델은 구글에 새로운 기회"라며"커뮤니티와 구글 이외의 사람들과 협력해 AI 개발에 새로운 기회를 만들 수 있다"고 말했다.
라틴어'보석'에서 이름을 얻은 젬마는 텍스트 정보만 처리하는 데 사용되며, 구글의 최강 AI 모델인 젬니와 일치하는 인프라 아키텍처를 가지고 있지만, 20억 매개변수와 70억 매개변수 두 가지 규모의 버전만 있는 작은 매개변수 규모이며, 두 가지 매개변수 규모의 젬마 모델은 모두 사전 훈련과 명령 미세 조정 버전이 있을 것이다.
작은 매개 변수 크기는 Gemma를 보다 광범위하게 배포하는 데 도움이 됩니다.젬마는 메인스트림 AI 프레임워크를 지원하며 노트북, 데스크탑, 사물인터넷, 모바일 기기, 클라우드 등에서도 작동한다고 구글은 설명했다.
이 회사가 발표 한 평가 결과에 따르면 Gemma는 수학, 코딩, 추론 정통성 및 지식 테스트 등 많은 외부 벤치마크 테스트에서 Llama 2 모델보다 우수합니다.Llama 2는 메타가 발표한 최신 오픈 소스 모델로, 70억, 130억, 700억 매개변수의 모델을 포함하고 있다.
특히 구글은 젬마를'오픈 소스'가 아니라 오픈 소스'라고 강조하는데, 이는 젬마의 소스 코드, 훈련 데이터 등 젬마의 다양한 기술 세부 사항을 공유하지 않는다는 것을 의미한다.앱에서 구글은 사용 약관이 모든 조직이 책임감 있게 상용화하고 배포할 수 있도록 허용한다고 밝혔다.
Gemma를 개방하거나 오픈 소스 대형 모델 분야에서 비판받는 부분에 대한 대응.앞서 구글과 오픈AI는 기술 폐쇄를 고수해 외부의 비난을 받았는데, 둘 다 최신, 최첨단 모델에서 모두 폐쇄원을 선택해 기술 진보에 불리한 것으로 여겨졌다.
이에 대해 시나웨이보 신기술 연구개발 책임자 장준림은 젬마는 구글의 대형 모델 전략의 전환을 대표한다-오픈 소스와 오픈 소스를 모두 고려하고, 오픈 소스는 성능이 가장 강력한 소규모 모델을 주력하며, 메타와 미스트랄 (유럽 AI 회사, 미스트랄 7B 오픈 소스 AI 모델 출시) 을 이기기를 희망한다;폐원은 규모가 큰 효과가 가장 좋은 큰 모델을 주력해 가능한 한 빨리 OpenAI를 따라잡으려 한다.
AI 커뮤니티에서 현재 메타의 Llama 2는 가장 강력한 오픈 소스 모델 중 하나였으며, 이 모델 정보와 소스 코드는 무료 상용화를 지원하기 때문에 많은 AI 개발자들의 지원을 받고 있다.
Google은 Gemma를 통해 더 많은 개발자를 Google 클라우드 생태계에 끌어들이기를 희망하는 것이 분명합니다.한편, 젬마는 구글이 자체 개발한 클라우드 AI 칩 TPU를 최적화해 더 나은 효능을 발휘할 수 있다고 주장했다.이와 동시에 구글 클라우드 신규 사용자는 또 300딸라의 클라우드 포인트를 획득하여 젬마를 연구하게 된다.
또한 젬마는 엔비디아 칩에서 실행될 수 있으며, 클라우드 데이터 센터, PC 측면에서 이 모델의 추론 성능을 가속화하기 위해 양측이 협력하여 최적화할 수 있을 것이다.예를 들어 젬마를 엔비디아 GPU를 탑재한 AI PC에 사용하여 로컬 챗봇 소프트웨어를 구동하고 엔비디아의 여러 AI 도구와 통합한다.
OpenAI, 구글, 메타 등 대형 기술 회사들의 대형 모델 전쟁은 갈수록 치열해지고 있다.
구글은 2023년 3월 AI 대화로봇 배드를 출시하고 지난해 5월 최신 폐원 대언어 모델인 PaLM2를 선보였다.지난주, 이 회사는"차세대 AI 대형 모델"인 Gemini 1.5를 관선하면서 여러 면에서 OpenAI의 GPT-4 터보를 추월했다고 밝혔다.메타는 모델 오픈 소스에 열중하며 Llama 2가 가장 유명하다.
최근 OpenAI가 발표한 문생 동영상 모델 Sora는 다시 AI 서클을 폭발시켜 다른 대형 모델 회사와의 거리를 더욱 벌렸다.구글이 최종적으로 OpenAI를 따라잡으려면 여전히 많은 불확실성으로 가득 찰 것이다.
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- iPhone 16 두 모델의 배송 시간이 단축되었습니다!무슨 신호?
- 애플, 인도 아이폰 모델별 판매가격 인하
- 유럽 프라이버시 규제 기관, 구글이 인공지능 모델에 데이터 활용 실태 조사
- 바이두 심떨림: 10만 카드 계산력 클러스터를 대상으로 계산 플랫폼 능력 문심 대모델 하루 조정량 7억 회 초과
- 메타, 메가톤급 신제품 발표: 299달러 Quest 3S 헤드, AR 안경 프로토타입, 다중모드 AI 모델
- 바이두 월드 2024는 11월 12일에 열릴 문심 대형 모델의 하루 평균 호출량이 이미 7억 건을 초과했다
- 포드 CEO는"지루한"모델 제조에 싫증이 났고, 개성화와 전동화 제품은"새로운 기쁨"이 되었다
- 홍콩 주식 애플 산업 사슬 상승!iPhone 16 Pro 모델의 수요는 여전히 견조하며 향후 판매량은 어떻습니까?
- 머스크 Cybercab 출시 임박!국내의 많은 거두들이 앞다투어 Robotaxi 중국 모델을 탐색하다
- 패러데이는 내년 말까지 2차 브랜드 첫 모델을 하차할 계획이다
-
アップル(AAPL)は現地時間10月31日、9月28日までの2024年第4四半期の業績を発表し、同四半期の売上高は前年同期比6%増の949億3000万ドル、純利益は同36%減の147億3600万ドルだった。 純利益の下落は主に102億ドル ...
- 亲亲宝宝贝贝贾
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
【英偉達の需要が高すぎる?SKハイニックス:黄仁勲がHBM 4チップの6カ月前納入を要求!】SKハイニックスの崔泰源(チェ・テウォン)会長は月曜日、インビダーの黄仁勲(ファン・インフン)CEOが同社の次世代高帯域 ...
- 琳271
- 昨天 17:54
- 支持
- 反对
- 回复
- 收藏
-
ファイザーが前立腺がんを治療する革新薬テゼナ& ;reg;(TALZENNA®,一般名:トルエンスルホン酸タラゾールパーリカプセル)は2024年10月29日に国家薬品監督管理局(NMPA)の承認を得て、HRR遺伝子突然変異 ...
- 什么大师特
- 半小时前
- 支持
- 反对
- 回复
- 收藏
-
南方財経は11月5日、中央テレビのニュースによると、現地時間11月5日、米ボーイング社のストライキ労働者が59%の投票結果で新たな賃金協定を受け入れ、7週間にわたるストライキを終えた。ストライキ労働者は11月12 ...
- Dubssgshbsbdhd
- 2 小时前
- 支持
- 反对
- 回复
- 收藏