找回密码
 立即注册
搜索
热搜: Apple Tesla Amazon
查看: 159|回复: 0

바이두는 프로그래머를 탈락시키려고 합니까?리옌훙, 코드 없는 개발 도구 발표

[复制链接]

37

主题

0

回帖

137

积分

注册会员

积分
137
发表于 2024-11-12 15:46:33 | 显示全部楼层 |阅读模式

1년전의 바이두세계대회에서 리언굉은 현장에서"손잡이"로 사용자들에게 AI원생응용을 가르쳤으며 업종에 계속 모형을 말지 말고 응용개발에 정력을 투입할것을 호소했다.
그러나 지난 12개월 동안 모두가 기대했던 슈퍼 앱은 나타나지 않았다.오히려 점점 더 많은 사람들이 이번 세계적인 대형 모델 열광이 도대체 새로운 기술 혁명인지, 아니면 새로운 거품인지 토론하기 시작했다.
리옌훙은 분명히 이런 의문을 들었다. 11월 12일 바이두 세계대회에서"중국 인공지능의 깃발을 든 사람으로서 우리는 이 문제에 대답할 자격이 있다고 생각한다"고 말했다."
그는 문심대모델의 최신 호출수치를 제시했는데 현재 문심대모델의 일평균 호출량은 이미 15억을 초과했으며 반년도 안되는 기간에 7.5배로 증가되였다.
6월에 이 수치가 금방 2억에 이르렀을 때 리언굉은 일찍 바이두고위관리들과 토론하여 큰 모형의 미래를"어떻게 부르는가"라고 토론했다. 당시의 결론은 이 호출량이 1년내에 10배 상승할수 있다는것이다.
그러나 지금 반년이 지난후 바이두는 이미 이 증가폭에 접근했다. 리언굉은 이는 사용자가 정말 큰 모형이 수요된다는것을 설명해주고있으며 종사자들은 이에 대해 충분히 안심할수 있다고 인정했다.
바이두는 개발자가 자사의 대형 모델 생태에 가입하는 문턱을 최소화하기 위해 내년 1월에 다중지능체 협업 도구인'초다'를 출시하겠다고 발표했다. 리옌훙은 이 제품은 코드를 전혀 모르는 사람도 애플리케이션 제품을 개발할 수 있도록 할 수 있다고 주장했다.
"우리는 전례가 없는, 생각만으로 돈을 벌 수 있는 시대를 맞이할 것이다."리옌훙은 무대 중앙에서 그의 대담한 예측을 했다.
환각을 없애는 것이 가장 중요한 전제이다
바이두는 개발자들이 모두 문심대모형에 기초하여 응용하도록 설복하려면 환각을 제거하는것이 가장 중요한 전제이다.
"만약 큰 모형이 늘 정색하고 허튼소리를 한다면 아무도 너를 믿지 않고 응용도 하지 않을것이며 지능이 아니라 지적장애이다."리언굉은 다음과 같이 표시했다. 지난 24개월간 큰 모형업종의 가장 큰 변화는 기본적으로 환각을 제거한것이다.
그의 견해에 의하면 대형모형은 확률모형으로서 생성된 내용은 원래 불확실성을 갖고있었는데 RAG (검색증강수단, Retrieval-augmented Generation) 기술을 채용한후 대형모형의 내용질과 정확성을 크게 제고시켰다.
올해 헤드 대형 모델 제조업체의 경쟁 진지는 모두 문생문에서 문생도와 문생영상 분야로 전환되고 있다. 가장 유명한 제품은 의심할 여지 없이 OpenAI가 발표한 문생영상 도구 Sora이다. 또한 국내 많은 회사들이 다중모드 분야에 힘을 쏟고 OpenAI에 입찰을 진행하도록 이끌었다.
촬영: 인터페이스 뉴스
리옌훙은"중국어 인터넷 전체가 소라의 가슴을 두드릴 때 이미지 생성의 환각 문제를 해결하기로 했다. 해결하지 않으면 응용이 없을 것"이라고 자신했다."
바이두가 내놓은 이 문생도 신기술은 iRAG (검색이 강화된 문생도 기술, image based RAG) 로 불린다.
그것의 기본 원리는 바이두가 검색하는 사진 자원 라이브러리와 바이두의 기초 괴상한 능력을 결합하여"기계 냄새"가 비교적 적은 사진을 생성하는 데 사용하며, 공식적으로는 그 효과가 문생도의 원생 시스템을 훨씬 능가한다고 말한다.
리언굉은 다음과 같이 말했다. 현재 시중에 대언어모형에 기초한 문생도시스템은 생성된 그림은 일반적으로"한눈의 가짜"이고 심지어 론리가 없다. 그러나 iRAG는 환각이 없고 초진실하며 원가가 낮아 기업고객에게 있어서 상업가치가 아주 높다.
현장에 전시된 폴크스바겐과 바이두의 협력 사례를 보면 AI로 포스터 사진을 생성하면 원가가 전통적인 수십만 원 한 조에서 0에 가깝게 낮아지고 생성된 차종은 폴크스바겐의 현실 속 차종과 일치한다.
이 기술의 잠재적 응용 장면은 현재 주로 영상 작품, 애니메이션 작품과 포스터 제작 등 분야에 집중되어 있다.
AI는 어디로 가는가: 지능체와 산업응용
지난 한해동안 리언굉은 내부와 외부의 여러차례 연설에서 모두 지능체의 중요성을 강조하면서 세계적범위에서 바이두처럼 지능체를 중요한 전략방향으로 삼는 과학기술회사가 많지 않다고 말했다.
오늘 바이두 세계대회에서 그는 이런 관점에 대해 보충 해석을 했다.
리옌훙은 지능체는 AI 네이티브 시대의 내용, 정보와 서비스의 새로운 담체로 변할 것이며, AI 시대에 지능체를 만드는 것은 PC 시대에 사이트를 만드는 것과 모바일 시대에 자체 미디어 계정을 만드는 것과 같으며, 다른 점은 지능체가 실물과 더 비슷하다는 것이라고 말했다.
한편으로 그것을 하는 문턱은 충분히 낮고, 리옌훙은 심지어 누구나 지능체를 만들 수 있다고 생각한다.바이두 문심지능체 플랫폼에서는 이미 11세의 초등학생이 지능체를 제작하고 있으며 검색 등을 통해 배포하는 데 성공했다.
다른 한편으로 지능체의 천장은 또 매우 높아 개발자가 기능이 아주 강한 응용을 할수 있도록 지원하기에 충분하다.특히 다중지능체의 협력은 더욱 복잡한 문제를 해결할수 있다.
공식
리언굉은 현장에서 주로 4가지 류형의 지능체의 응용을 전시했다. 즉 회사류 지능체, 역할류 지능체, 도구류 지능체와 업종류 지능체이다.
회사류 지능체는 주로 전통적인 공식 홈페이지의 기능을 대체하여 회사 소개, 제품 사진과 일대일 서비스 등 능력을 제공한다;역할류 지능체는 주로 디지털인 (큰 모형에 기초한) 제품을 가리키며 생방송, 자문과 교육 등 분야에 응용된다.도구류 지능체는 현재 글쓰기 도우미와 디자인 도우미 등 도구 측면에 더 많이 집중되어 있다;업종류 지능체는 주로 법률, 의료건강, 금융과 여행 등 수직령역을 대상으로 한다.
분류적으로 볼 때 리언굉이 바이두를 위해 묘사한 지능체응용장면은 기본적으로 모두 현실적수요가 비교적 많은 분야이지만 관건은 어떻게 개발자를 설복하여 참여하게 하고 그들에게 충분한 보답을 줄것인가에 있다.
산업 응용 측면에서 현재 바이두의 고객은 주로 금융, 에너지, 교육 및 공공 서비스 분야에 집중되어 있습니다.바이두 스마트 클라우드의 천범대 모델 플랫폼에는 누적 3만 3000개의 정조대 모델과 77만 개의 기업급 응용이 있다.
업계 사례 소개에서 바이두가 내놓은 것은 백승 중국과의 협력 사례다.쌍방의 협력범위는 점포부지선정, 지능고객센터, 내부대모형서비스제품에 이르기까지 모두 관련되였고 바이두도 천범플랫폼과 기초계산력서비스를 백승에게 제공했으며 앞으로 두 회사는 또 주문스크린에서 대모형으로 주문하는 기술타당성을 엄중히 하게 된다.
의심할바없이 백승중국이라는 이런 유명한 브랜드는 바이두가 자기집 대형모형서비스를 보급하는데 시급히 수요되는 본보기고객이다.올해 세계대회에서 폴크스바겐, 비야디, 백승중국과 지련채용 등 머리회사의 사례는 리언굉에 의해 중점적으로 소개되였다. 바이두는 그들로 더욱 많은 중소개발자를 유치하고 함께 바이두의 대형모형생태에 가입하기를 분명히 희망했다.
이를 위해 바이두는 또 공식추천책략을 발동하여 전문적으로"산업응용 TOP 100"의 순위표를 발표하여 문심대모형에 기초하여 개발한 이런 량질업종응용을 외부에 추천했다.
리언굉은 다음과 같이 말했다. 바이두는"슈퍼응용"을 출시하려는 것이 아니라 더욱 많은 기업들이 백만의"슈퍼유용"응용을 구축하도록 하려는 것이다.
초다, 프로그래머 탈락시키려고?
지능체를 보급하든 업종응용을 보급하든 문턱을 낮추는것은 모두 바이두가 시급히 해결해야 할 문제이다.
리옌훙은 현장에서 애플을 패러디해'원 모어 씽큐'제품, 즉'초다'를 선보였다.공식 포지셔닝에서 이것은 코드를 쓰지 않고도 응용을 할 수 있는 소프트웨어로 기초적인 큰 모델과 지능체로 구성되어 있다.
"그것은 지금까지 인류력사에서 가장 복잡한 다지능체협력도구이다."리언굉은 다음과 같이 말했다. 이 제품은 코드를 전혀 모르는 사람으로 하여금 프로그래머의 능력을 구비하게 하고 그 어떤 생각도 재빨리 저비용으로 응용제품으로 변화시킬수 있다.
촬영: 인터페이스 뉴스
비록 많은 동업자들이 이런 종류의 제품을 만들고 있지 않아, 이"인류의 가장"의 일부 정어가 너무 많지만, 바이두가 이 제품에 대한 시도 사고방식은 매우 명확하다.
일반 사용자가 그것에 대한 요구를 제기하면, 초의 0호 지능 체득 분석 지령을 하달하고 스케줄링 계획을 하달하며, 임무를 수요 확정, 내용 생산 및 공정 개발 세 단계로 분할하고, 여러 지능체를 소환하여 협력하여 모든 개발 임무를 완수하고, 최종적으로 사용자가 필요로 하는 응용 제품을 송출한다.
현장 프레젠테이션에서 발표회의 초대 시스템은 사용자의 요청 발송에서 제품 개발 종료까지 3분밖에 걸리지 않으며, 사용자는 코드 한 줄을 쓸 필요가 없다.
리언굉은 다음과 같이 표시했다. 초다는 무코드프로그래밍, 다지능체협력과 다도구호출의 우세를 갖고있어 사용자는 자연언어상호작용의 힘을 빌어 일련의 시스템구축을 완성할수 있다.
이 제품은 현장 시연에서 많은 참석자들의 뚜렷한 흥미를 불러일으켰다. 인터페이스 뉴스가 만난 몇몇 기업 개발자들은 모두 그의 능력 범위가 얼마나 큰지, 정말 일반 프로그래머를 대체할 수 있는지 알고 싶었다. 아쉽게도 현장에서는 그다지 상세한 전시가 진행되지 않았다.
초다는 내년 1월에 정식으로 발표된다. 리옌훙은 기초모델 능력이 향상됨에 따라 초다는 더욱 복잡한 일을 할 수 있을 것이며, 앞으로 기업은 프로젝트 매니저, 설계자, 개발자, 테스트 인원을 채용하지 않고도 독립적으로 여러 지능체를 지휘하여 협동하여 응용을 개발할 수 있을 것이라고 말했다.
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|www.LogoMoeny.com

GMT+8, 2024-11-30 15:37 , Processed in 0.135470 second(s), 8 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表