首页 신문 正文

"외부에서는 큰 모델에 대해 상당히 많은 오해가 있다."최근 리옌훙의 내부 연설이 폭로되었다.리옌훙은 앞으로 큰 모델 간의 격차가 점점 더 커질 수 있다고 생각한다.그는 더 나아가 큰 모델의"천장"이 매우 높고, 현재 이상적인 상황과는 거리가 매우 멀기 때문에 모델이 끊임없이 빠르게 반복되고 업데이트되고 업그레이드되어야 한다고 설명했습니다.몇 년, 십여 년을 하루처럼 투입하여 끊임없이 사용자의 수요를 만족시키고 원가를 낮추고 효율을 높여야 한다.
업계의"큰 모델 사이의 능력은 이미 장벽이 없다"는 주장에 대해 리옌훙은"매번 새로운 모델이 발표될 때마다 GPT-4o와 비교해야 한다. 나의 득점은 이미 그것과 많이 차이가 없다. 심지어 어떤 항목의 득점은 이미 그것을 초과했다. 그러나 이것은 결코 가장 선진적인 모델과 차이가 없다는 것을 나타내지 않는다."
그는 많은 모델들이 자신을 증명하기 위해 발표 후 차트를 치고 테스트 문제, 답안 기교를 맞힌다. 차트에서 볼 때 모델의 능력이 이미 비슷했을 수도 있다며"그러나 실제 응용에 이르기까지 실력은 여전히 뚜렷한 차이가 있다"고 말했다.
리옌훙은 모델 간의 격차가 다차원적이라고 지적했다.업종은 흔히 리해, 생성, 론리, 기억 등 능력의 격차에 더욱 관심을 돌리지만 원가, 추리속도 등 차원을 홀시한다. 일부 모델은 비록 같은 효과를 거둘수 있지만 원가가 높고 추리속도가 느려 여전히 선진모델보다 못하다.
리옌훙은 또"큰 모델 시대 이전에 개원은 무료, 원가가 낮다는 것에 익숙해졌다"고 말했다.그는 예를 들어 오픈 소스 리눅스는 이미 컴퓨터가 있기 때문에 리눅스를 사용하는 것은 무료라고 설명했다.그러나 이런 것들은 큰 모형 시대에 성립되지 않는다. 큰 모형 추리는 매우 비싸다. 오픈 소스 모형도 계산력을 보내지 않는다. 또한 스스로 설비를 사야 한다. 계산력의 고효율 이용을 실현할 수 없다.
"효율상 오픈 소스 모델은 안 된다."그는 "폐원 모델은 정확히 비즈니스 모델이라고 해야 한다. 수많은 사용자가 연구 개발 비용을 분담하고 추리용 기계 자원과 GPU를 분담하는 것이다. GPU의 사용 효율은 가장 높다. 바이두 문심 대형 모델의 3.5, 4.0의 GPU 사용률은 모두 90% 이상에 달한다."
리옌훙은 교수과학연구 등 분야에서 오픈 소스 모델은 가치가 있다고 분석했습니다.그러나 비즈니스 분야에서 효율, 효과, 최저 비용을 추구할 때 오픈 소스 모델은 장점이 없다.
대형 모델 응용 차원에서 리옌훙은 가장 먼저 나타난 것은 Copilot으로 사람을 보조한다;다음은 Agent 지능체로서 일정한 자주성이 있어 자주적으로 도구를 사용하고 반성하며 스스로 진화할수 있다.이런 자동화 정도가 다시 발전하면 AI Worker가 되어 각 방면의 일을 독립적으로 완성할 수 있다.
그는 또"많은 사람들이 지능체라는 발전 방향을 긍정적으로 보고 있지만, 오늘날까지 지능체는 아직 공감대가 아니다. 바이두처럼 지능체를 큰 모델의 가장 중요한 전략, 가장 중요한 발전 방향으로 삼는 회사는 많지 않다"고 말했다.
리언굉은 다음과 같이 인정했다. 지능체의 문턱은 확실히 매우 낮다. 많은 사람들은 어떻게 큰 모형을 응용으로 변화시킬것인가를 모르지만 지능체는 아주 직접적이고 능률적이며 간단한 방식으로서 모형우에서 지능체를 구축하는데 상당히 편리하다.
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

茵665 新手上路
  • 粉丝

    0

  • 关注

    0

  • 主题

    1