리언굉 내부연설 폭로: 개원모델 효률이 높지 않아 계산력문제를 해결할수 없다
茵665
发表于 2024-9-11 17:15:56
1389
0
0
"외부에서는 큰 모델에 대해 상당히 많은 오해가 있다."최근 리옌훙의 내부 연설이 폭로되었다.리옌훙은 앞으로 큰 모델 간의 격차가 점점 더 커질 수 있다고 생각한다.그는 더 나아가 큰 모델의"천장"이 매우 높고, 현재 이상적인 상황과는 거리가 매우 멀기 때문에 모델이 끊임없이 빠르게 반복되고 업데이트되고 업그레이드되어야 한다고 설명했습니다.몇 년, 십여 년을 하루처럼 투입하여 끊임없이 사용자의 수요를 만족시키고 원가를 낮추고 효율을 높여야 한다.
업계의"큰 모델 사이의 능력은 이미 장벽이 없다"는 주장에 대해 리옌훙은"매번 새로운 모델이 발표될 때마다 GPT-4o와 비교해야 한다. 나의 득점은 이미 그것과 많이 차이가 없다. 심지어 어떤 항목의 득점은 이미 그것을 초과했다. 그러나 이것은 결코 가장 선진적인 모델과 차이가 없다는 것을 나타내지 않는다."
그는 많은 모델들이 자신을 증명하기 위해 발표 후 차트를 치고 테스트 문제, 답안 기교를 맞힌다. 차트에서 볼 때 모델의 능력이 이미 비슷했을 수도 있다며"그러나 실제 응용에 이르기까지 실력은 여전히 뚜렷한 차이가 있다"고 말했다.
리옌훙은 모델 간의 격차가 다차원적이라고 지적했다.업종은 흔히 리해, 생성, 론리, 기억 등 능력의 격차에 더욱 관심을 돌리지만 원가, 추리속도 등 차원을 홀시한다. 일부 모델은 비록 같은 효과를 거둘수 있지만 원가가 높고 추리속도가 느려 여전히 선진모델보다 못하다.
리옌훙은 또"큰 모델 시대 이전에 개원은 무료, 원가가 낮다는 것에 익숙해졌다"고 말했다.그는 예를 들어 오픈 소스 리눅스는 이미 컴퓨터가 있기 때문에 리눅스를 사용하는 것은 무료라고 설명했다.그러나 이런 것들은 큰 모형 시대에 성립되지 않는다. 큰 모형 추리는 매우 비싸다. 오픈 소스 모형도 계산력을 보내지 않는다. 또한 스스로 설비를 사야 한다. 계산력의 고효율 이용을 실현할 수 없다.
"효율상 오픈 소스 모델은 안 된다."그는 "폐원 모델은 정확히 비즈니스 모델이라고 해야 한다. 수많은 사용자가 연구 개발 비용을 분담하고 추리용 기계 자원과 GPU를 분담하는 것이다. GPU의 사용 효율은 가장 높다. 바이두 문심 대형 모델의 3.5, 4.0의 GPU 사용률은 모두 90% 이상에 달한다."
리옌훙은 교수과학연구 등 분야에서 오픈 소스 모델은 가치가 있다고 분석했습니다.그러나 비즈니스 분야에서 효율, 효과, 최저 비용을 추구할 때 오픈 소스 모델은 장점이 없다.
대형 모델 응용 차원에서 리옌훙은 가장 먼저 나타난 것은 Copilot으로 사람을 보조한다;다음은 Agent 지능체로서 일정한 자주성이 있어 자주적으로 도구를 사용하고 반성하며 스스로 진화할수 있다.이런 자동화 정도가 다시 발전하면 AI Worker가 되어 각 방면의 일을 독립적으로 완성할 수 있다.
그는 또"많은 사람들이 지능체라는 발전 방향을 긍정적으로 보고 있지만, 오늘날까지 지능체는 아직 공감대가 아니다. 바이두처럼 지능체를 큰 모델의 가장 중요한 전략, 가장 중요한 발전 방향으로 삼는 회사는 많지 않다"고 말했다.
리언굉은 다음과 같이 인정했다. 지능체의 문턱은 확실히 매우 낮다. 많은 사람들은 어떻게 큰 모형을 응용으로 변화시킬것인가를 모르지만 지능체는 아주 직접적이고 능률적이며 간단한 방식으로서 모형우에서 지능체를 구축하는데 상당히 편리하다.
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- 울래, 전기교환서비스비용수취모식 조정: 정도에 따라 비용을 수취하고 락도의 후속전기교환도 계속 사용하게 된다
- 애플 홈페이지 강탈 붕괴!iPhone 16 일부 모델"초 없음"
- 바이두 오단: 지식 증강 대형 모델 재구성 산업 디지털 엔진
- iPhone 16 두 모델의 배송 시간이 단축되었습니다!무슨 신호?
- 애플, 인도 아이폰 모델별 판매가격 인하
- 유럽 프라이버시 규제 기관, 구글이 인공지능 모델에 데이터 활용 실태 조사
- 바이두 심떨림: 10만 카드 계산력 클러스터를 대상으로 계산 플랫폼 능력 문심 대모델 하루 조정량 7억 회 초과
- 메타, 메가톤급 신제품 발표: 299달러 Quest 3S 헤드, AR 안경 프로토타입, 다중모드 AI 모델
- 바이두 월드 2024는 11월 12일에 열릴 문심 대형 모델의 하루 평균 호출량이 이미 7억 건을 초과했다
- 포드 CEO는"지루한"모델 제조에 싫증이 났고, 개성화와 전동화 제품은"새로운 기쁨"이 되었다
-
9月が終わり、映画・テレビ業界が暗躍している。最近、愛奇芸の創始者でCEOのGONG宇氏は、映画・テレビ業界が長短の変化、AIの変化、中国映画・テレビドラマの海外進出の変化の3つの変化を経験していると発表した。 ...
- 寒郁轩良
- 昨天 14:17
- 支持
- 反对
- 回复
- 收藏
-
8月のトヨタ自動車(ダイハツ自動車と日野自動車を除く、レクサスを含む)の世界生産台数は前年同月比11.2%減の709571台、世界販売台数は前年同月比3.1%減の826863台だった。 日本本土市場では、トヨタ自動車の8月 ...
- SOGO
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
ネットワーク状況監視サイトDownDetectorによると、オーディオストリーミングプラットフォームSpotifyは日曜日に約3時間にわたる障害を経験した後、正常に回復し、ピーク時には米国の4万人以上のユーザーに影響を与 ...
- hecgdge4
- 昨天 09:33
- 支持
- 反对
- 回复
- 收藏
-
百済神州(688235.SH)はA株の有名な革新薬企業で、2017-2024年上半期、同社の各期の研究開発投資はA株の化学製薬会社(申万二級)の中で最も高く、研究開発費用は合計600億元を超えた。 しかし、百済神州にとって ...
- wylz8473
- 前天 18:36
- 支持
- 反对
- 回复
- 收藏