리언굉 내부연설 폭로: 개원모델 효률이 높지 않아 계산력문제를 해결할수 없다
茵665
发表于 2024-9-11 17:15:56
1407
0
0
"외부에서는 큰 모델에 대해 상당히 많은 오해가 있다."최근 리옌훙의 내부 연설이 폭로되었다.리옌훙은 앞으로 큰 모델 간의 격차가 점점 더 커질 수 있다고 생각한다.그는 더 나아가 큰 모델의"천장"이 매우 높고, 현재 이상적인 상황과는 거리가 매우 멀기 때문에 모델이 끊임없이 빠르게 반복되고 업데이트되고 업그레이드되어야 한다고 설명했습니다.몇 년, 십여 년을 하루처럼 투입하여 끊임없이 사용자의 수요를 만족시키고 원가를 낮추고 효율을 높여야 한다.
업계의"큰 모델 사이의 능력은 이미 장벽이 없다"는 주장에 대해 리옌훙은"매번 새로운 모델이 발표될 때마다 GPT-4o와 비교해야 한다. 나의 득점은 이미 그것과 많이 차이가 없다. 심지어 어떤 항목의 득점은 이미 그것을 초과했다. 그러나 이것은 결코 가장 선진적인 모델과 차이가 없다는 것을 나타내지 않는다."
그는 많은 모델들이 자신을 증명하기 위해 발표 후 차트를 치고 테스트 문제, 답안 기교를 맞힌다. 차트에서 볼 때 모델의 능력이 이미 비슷했을 수도 있다며"그러나 실제 응용에 이르기까지 실력은 여전히 뚜렷한 차이가 있다"고 말했다.
리옌훙은 모델 간의 격차가 다차원적이라고 지적했다.업종은 흔히 리해, 생성, 론리, 기억 등 능력의 격차에 더욱 관심을 돌리지만 원가, 추리속도 등 차원을 홀시한다. 일부 모델은 비록 같은 효과를 거둘수 있지만 원가가 높고 추리속도가 느려 여전히 선진모델보다 못하다.
리옌훙은 또"큰 모델 시대 이전에 개원은 무료, 원가가 낮다는 것에 익숙해졌다"고 말했다.그는 예를 들어 오픈 소스 리눅스는 이미 컴퓨터가 있기 때문에 리눅스를 사용하는 것은 무료라고 설명했다.그러나 이런 것들은 큰 모형 시대에 성립되지 않는다. 큰 모형 추리는 매우 비싸다. 오픈 소스 모형도 계산력을 보내지 않는다. 또한 스스로 설비를 사야 한다. 계산력의 고효율 이용을 실현할 수 없다.
"효율상 오픈 소스 모델은 안 된다."그는 "폐원 모델은 정확히 비즈니스 모델이라고 해야 한다. 수많은 사용자가 연구 개발 비용을 분담하고 추리용 기계 자원과 GPU를 분담하는 것이다. GPU의 사용 효율은 가장 높다. 바이두 문심 대형 모델의 3.5, 4.0의 GPU 사용률은 모두 90% 이상에 달한다."
리옌훙은 교수과학연구 등 분야에서 오픈 소스 모델은 가치가 있다고 분석했습니다.그러나 비즈니스 분야에서 효율, 효과, 최저 비용을 추구할 때 오픈 소스 모델은 장점이 없다.
대형 모델 응용 차원에서 리옌훙은 가장 먼저 나타난 것은 Copilot으로 사람을 보조한다;다음은 Agent 지능체로서 일정한 자주성이 있어 자주적으로 도구를 사용하고 반성하며 스스로 진화할수 있다.이런 자동화 정도가 다시 발전하면 AI Worker가 되어 각 방면의 일을 독립적으로 완성할 수 있다.
그는 또"많은 사람들이 지능체라는 발전 방향을 긍정적으로 보고 있지만, 오늘날까지 지능체는 아직 공감대가 아니다. 바이두처럼 지능체를 큰 모델의 가장 중요한 전략, 가장 중요한 발전 방향으로 삼는 회사는 많지 않다"고 말했다.
리언굉은 다음과 같이 인정했다. 지능체의 문턱은 확실히 매우 낮다. 많은 사람들은 어떻게 큰 모형을 응용으로 변화시킬것인가를 모르지만 지능체는 아주 직접적이고 능률적이며 간단한 방식으로서 모형우에서 지능체를 구축하는데 상당히 편리하다.
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- iPhone 16 두 모델의 배송 시간이 단축되었습니다!무슨 신호?
- 애플, 인도 아이폰 모델별 판매가격 인하
- 유럽 프라이버시 규제 기관, 구글이 인공지능 모델에 데이터 활용 실태 조사
- 바이두 심떨림: 10만 카드 계산력 클러스터를 대상으로 계산 플랫폼 능력 문심 대모델 하루 조정량 7억 회 초과
- 메타, 메가톤급 신제품 발표: 299달러 Quest 3S 헤드, AR 안경 프로토타입, 다중모드 AI 모델
- 바이두 월드 2024는 11월 12일에 열릴 문심 대형 모델의 하루 평균 호출량이 이미 7억 건을 초과했다
- 포드 CEO는"지루한"모델 제조에 싫증이 났고, 개성화와 전동화 제품은"새로운 기쁨"이 되었다
- 홍콩 주식 애플 산업 사슬 상승!iPhone 16 Pro 모델의 수요는 여전히 견조하며 향후 판매량은 어떻습니까?
- 머스크 Cybercab 출시 임박!국내의 많은 거두들이 앞다투어 Robotaxi 중국 모델을 탐색하다
- 패러데이는 내년 말까지 2차 브랜드 첫 모델을 하차할 계획이다
-
アップル(AAPL)は現地時間10月31日、9月28日までの2024年第4四半期の業績を発表し、同四半期の売上高は前年同期比6%増の949億3000万ドル、純利益は同36%減の147億3600万ドルだった。 純利益の下落は主に102億ドル ...
- 亲亲宝宝贝贝贾
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
【英偉達の需要が高すぎる?SKハイニックス:黄仁勲がHBM 4チップの6カ月前納入を要求!】SKハイニックスの崔泰源(チェ・テウォン)会長は月曜日、インビダーの黄仁勲(ファン・インフン)CEOが同社の次世代高帯域 ...
- 琳271
- 昨天 17:54
- 支持
- 反对
- 回复
- 收藏
-
【マスクはテスラが携帯電話を作ることに応えた:作れるが作らないアップルとグーグルが悪さをしない限り】現地時間11月5日、有名ポッドキャストのジョローガン氏のインタビューに応じ、「携帯電話を作るのは私たち ...
- 波大老师
- 1 分钟前
- 支持
- 反对
- 回复
- 收藏
-
超マイクロコンピュータは最近、監査人の辞任と財務危機で株価が急落し、市場では退市が噂され、多くの懸念が出ている。超マイクロコンピュータは、これまで雄大なパートナーとされてきたが、その運命は業界関係者 ...
- hecgdge4
- 1 小时前
- 支持
- 反对
- 回复
- 收藏