대언어 모델은 AI의'끝'이 아니다?메타 수석 과학자: 여전히 인간의 지혜를 따라갈 수 없다
君子一严
发表于 2024-5-23 18:00:57
1435
0
0
메타의 수석 인공지능(AI) 과학자 얀 리쿤 (Yann LeCun) 은 기존의 대형 언어 모델 (LLM) 이 인간과 같은 추리와 계획 능력을 결코 실현할 수 없다고 주장했다.
양립곤은 다음과 같이 표시했다. 대형언어모델은"론리에 대한 리해가 아주 제한되여있다. 그것은 물질세계를 료해하지 못하고 지속적인 기억이 없으며 그 어떤 합리적인 용어정의로도 추리할수 없으며 층별계획도 진행할수 없다."
최근 인터뷰에서 그는 기존의 첨단 대형 언어 모델에 의존하여 인간의 지혜에 필적하는 범용 인공지능 (AGI) 을 만들 수 없다고 생각했다. 이 모델들은 정확한 훈련 데이터를 얻은 경우에만 제시에 정확하게 대답할 수 있기 때문에"본질적으로 안전하지 않다"고 말했다.
구체적으로 말하자면, 양리쿤은 현재의 대형 언어 모델은 비록 자연 언어 처리, 대화 이해, 대화 인터렉션, 텍스트 창작에서 뛰어난 성과를 가지고 있지만, 그것은 여전히"통계 모델링"기술일 뿐이며, 데이터 중의 통계 법칙을 학습하여 관련 임무를 완수하는 것은 본질적으로 진정으로 이해와 추리 능력을 가진 것이 아니라고 생각한다.
양리쿤 자신은 차세대 인공지능 시스템을 개발하기 위해 노력하고 있다. 그는 이 시스템이 인간의 지능 수준을 갖춘 기계에 동력을 제공하여 기계에서'슈퍼 지능'을 창조할 수 있기를 희망한다.그러나 그는 이 비전이 실현되기까지 10년이 걸릴 수 있다고 지적했다.
"세계 모델링" 방법
양리쿤은 메타의 기초 인공지능 연구(Fair) 실험실에서 약 500명의 팀을 관리하고 있다.그들은'상식'을 형성할 수 있는 인공지능을 만들고 인간과 비슷한 방식으로 세계의 작동 방식을 관찰하고 체험하며 학습해 궁극적으로'세계 모델링'이라고 불리는 범용 인공지능(AGI)을 실현하기 위해 노력하고 있다.
2022년, 양립곤은 처음으로"세계모델링"비전에 관한 론문을 발표했는데 그후 메타는 이 방법을 바탕으로 두가지 연구모형을 발표했다.
양립곤은 최근 다음과 같이 지적했다.Fair 실험실은 인공 지능이 궁극적으로 인간의 지적 수준에 도달 할 수있도록하기 위해 다양한 아이디어를 테스트하고 있지만,"이 중에는 많은 불확실성과 탐구가 있으며, 우리는 또한 어느 것이 성공할 것인지, 어느 것이 최종적으로 선택 될 것인지를 판단할 수 없다"고 말했다.
또 "우리는 차세대 인공지능 시스템의 풍랑에 처해 있다"고 굳게 주장했다.
내부 갈등
그러나 이 과학자의 실험적 비전은 현재 투자자들이 인공지능 투자의 빠른 수익을 더 원하기 때문에 메타사에 값비싼 도박이다.
그래서메타 사내에서도'단기 수입'과'장기 가치'사이에 대한 견해차가 나타나고 있다.이 같은 이견은 지난해 GenAI 팀 출범을 보면 알 수 있다.
메타는 2013년 인공지능 연구 분야를 개척하기 위해 페어 랩을 설립했으며 이 분야 최고 학자들을 영입했다.하지만 2023년에는Meta는 Fair 실험실에서 많은 인공 지능 연구자와 엔지니어를 영입하고 Llama 3 모델의 작업을 이끌었으며 새로운 인공 지능 어시스턴트와 이미지 생성 도구와 같은 제품에 통합한 Chris Cox 최고 제품 책임자가 이끄는 새로운 GenAI 팀을 따로 그었습니다.
일부 내부 인사들은GenAI 팀의 설립은 아마도 양리쿤과 메타 최고 행정관 저커버그 두 사람이 이념적으로 어떤 모순이 있기 때문일 것이다.저커버그는 투자자들의 압력과 수익 압력 속에서 인공지능의 더 많은 상업화 응용을 추진해 왔다;반면 페어랩 내부의 학원파 문화는 메타를 생성식 인공지능 열풍에서 약간'약세'를 보이고 있다.
양립곤이 이 관점을 발표할 때메타와 경쟁사들은 지난주 OpenAI가 발표한 더 빠른 GPT-4o 모델을 포함한 더 많은 향상된 버전의 대형 언어 모델을 추진하고 있다;구글은 새로운'다중 모드'AI 어시스턴트 Project Astra를 출시했습니다.메타는 지난달 최신 Llama 3 모델도 선보였다.
이러한 최신 대형 언어 모델에 대해 양리쿤은 거들떠보지도 않는다. 그는"대형 언어 모델의 이러한 진화는 천박하고 제한되어 있다. 인간 엔지니어가 개입하여 이러한 정보에 근거하여 훈련할 때만 모델이 학습할 수 있다. 인간처럼 자연스럽게 결론을 내리는 것이 아니다."이는 자신의 Llama 모델의 얼굴을 때리는 것과 같다.
비록 관념적으로 모순이 존재하지만 한 소식통에 따르면 양립곤은 여전히 저커버그의 핵심고문중의 하나이다. 왜냐하면 그는 인공지능분야에서 극히 큰 명성을 갖고있기때문이다.
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- 패러데이 퓨처: 제2브랜드 FX는 두 가지 모델을 출시할 계획이며, 가격은 5만 달러를 넘지 않는다
- 월마트는 샘의"전치 창고"모델을 복제하여 작은 가게를 열 수도 있다
- DeepMind 오픈 소스 생체 분자 예측 모델 노상 성과는 AI 제약 물결을 일으킬 것인가?
- 바이두 리언굉: 지난 24개월간 AI 업종의 가장 큰 변화는 큰 모형이 기본적으로 환각을 제거한것이다
- "AI 신세대"대모형제조업체 일제히"권"지능체, 리언굉은"생각으로 돈을 벌수 있는 시대"를 맞이하게 된다고 말했다.
- 극크립톤, 전계차종과 함께 광주모터쇼 첫 광대한 지운전 2.0 종단간 Plus 구조 선보여
- 문심일언 사용자 수 4억 돌파, 바이두 오단: 큰 모형이 산업 스마트 엔진을 재창조하고 있다
- 올해 10월 테슬라 모델 Y가 일선, 신일선 도시 모델 판매 1위를 차지했다
- 알리바바 CEO 오영명: AI 발전은 부동한 규모, 부동한 령역의 개원대모형이 필요하다
- 바이두 Q3 핵심 순이익 17% 증가 예상 초과 문심대 모델 하루 조정량 15억
-
11月21日、2024世界インターネット大会烏鎮サミットで、創業者、CEOの周源氏が大会デジタル教育フォーラムとインターネット企業家フォーラムでそれぞれ講演、発言したことを知っている。周源氏によると、デジタル教 ...
- 不正经的工程师
- 昨天 16:36
- 支持
- 反对
- 回复
- 收藏
-
スターバックスが中国事業の株式売却の可能性を検討していることが明らかになった。 11月21日、外国メディアによると、スターバックスは中国事業の株式売却を検討している。関係者によると、スターバックスは中国事 ...
- 献世八宝掌
- 前天 16:29
- 支持
- 反对
- 回复
- 收藏
-
【意法半導体CEO:中国市場は非常に重要で華虹と協力を展開】北京時間11月21日、意法半導体(STM.N)は投資家活動の現場で、同社が中国ウェハー代工場の華虹公司(688347.SH)と協力していると発表した。伊仏半導体 ...
- 黄俊琼
- 前天 14:29
- 支持
- 反对
- 回复
- 收藏
-
【ナスダック中国金龍指数は1%下落した。人気の中概株の多くは下落した】現地時間11月21日、ナスダック中国金龍指数は1%下落し、人気の中概株の多くは下落し、必死に10%超下落し、愛奇芸は7%超下落し、百度は6%近く ...
- 比尔992
- 昨天 11:57
- 支持
- 反对
- 回复
- 收藏