首页 신문 正文

7월 4일, 바이두 창시자 겸 CEO 리옌훙은 2024 세계인공지능대회 및 인공지능 글로벌거버넌스 고위급 회의 산업발전 주포럼에서 개원과 폐원 대모델 논쟁에 대해 재차 언급했다. 그는 개원 대모델은 학술연구, 교수분야 등 특정 장면에서 존재하는 가치가 있지만 대다수 응용장면에는 적용되지 않는다고 밝혔다."당신이 치열한 경쟁 환경에 처해 있을 때, 업무 효율을 동업자보다 더 높이고, 원가를 동업자보다 더 낮게 해야 한다. 이때 상업화된 폐원 모델이 가장 잘 칠 수 있다."동시에 큰 모델의 중점은 역시"볼륨 응용"이다."응용 없이 기초 모델만 있으면 개원이든 폐원이든 한 푼의 가치도 없다."
"올해 (2024년) 이후 많은 사람들이 모델 오픈 소스와 코드 오픈 소스의 개념을 혼동하고 있다."리옌훙은"모델 오픈 소스는 한 무더기의 매개변수만 얻을 수 있다. SFT를 하고 안전하게 정렬해야 한다. 대응 소스 코드를 받더라도 얼마나 많은 비율, 어떤 비율의 데이터를 사용하여 이 매개변수를 훈련시켰는지 모른다. 많은 사람들이 땔감을 줍고 불꽃이 높은 것을 얻을 수 없다. 거인의 어깨에 서서 반복적으로 개발할 수 없다."
리옌훙은 같은 매개변수 규모에서 오픈 소스 모델의 능력은 오픈 소스보다 못하다고 직언했다."만약 오픈 소스가 폐쇄 소스를 추평할 수 있는 능력을 원한다면, 그것은 더 큰 매개변수 규모가 있어야 한다. 이는 추리 비용이 더 높고 반응 속도가 더 느리다는 것을 의미한다.많은 사람들이 오픈 소스 모델을 가지고 개조를 하는데, 이렇게 하면 자신의 개성화 된 요구를 더 잘 서비스할 수 있다고 생각하는데, 이것이 하나의 외톨이 모델이 되어 기초 모델의 지속적인 업그레이드에서 이익을 얻을 수도 없고 다른 사람도 공유할 수도 없다"고 말했다.
그는 오픈 소스 모델이 일부 학술 연구, 교수 분야에서 존재 가치가 있으며 큰 모델의 작업 메커니즘을 연구하고 이론을 형성하는 데 사용할 수 있다고 인정했다.그러나 오픈 소스 모델은 대부분의 응용 시나리오에 적용되지 않으며, 치열한 비즈니스 환경에서 비즈니스 효율이 동업자보다 높고 비용이 동업자보다 낮도록 하려면 상업화된 폐원 모델이"가장 잘 칠 수 있는"이다.그는 바이두의 소설 창작에서의 실천을 예로 들면, 오픈 소스 모델에서 경량급 모델로, 다시 문심대 모델 4.0으로 전환한 후, 소설 생성의 가용률과 양질률이 크게 향상되어 인터넷 글쓴이가 날개를 달게 되었다.리옌훙이 보기에 큰 모델의 중점은 역시'볼륨 응용'이다."응용이 없고 기초 모델만 있으면 오픈 소스든 클로징 소스든 한 푼의 가치도 없다."
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

123458224 新手上路
  • 粉丝

    0

  • 关注

    0

  • 主题

    2