대언어 모델은 AI의'끝'이 아니다?메타 수석 과학자: 여전히 인간의 지혜를 따라갈 수 없다

君子一严发表于 2024-5-23 18:00:57

1435 0 0

메타의 수석 인공지능(AI) 과학자 얀 리쿤 (Yann LeCun) 은 기존의 대형 언어 모델 (LLM) 이 인간과 같은 추리와 계획 능력을 결코 실현할 수 없다고 주장했다.
양립곤은 다음과 같이 표시했다. 대형언어모델은"론리에 대한 리해가 아주 제한되여있다. 그것은 물질세계를 료해하지 못하고 지속적인 기억이 없으며 그 어떤 합리적인 용어정의로도 추리할수 없으며 층별계획도 진행할수 없다."
최근 인터뷰에서 그는 기존의 첨단 대형 언어 모델에 의존하여 인간의 지혜에 필적하는 범용 인공지능 (AGI) 을 만들 수 없다고 생각했다. 이 모델들은 정확한 훈련 데이터를 얻은 경우에만 제시에 정확하게 대답할 수 있기 때문에"본질적으로 안전하지 않다"고 말했다.
구체적으로 말하자면, 양리쿤은 현재의 대형 언어 모델은 비록 자연 언어 처리, 대화 이해, 대화 인터렉션, 텍스트 창작에서 뛰어난 성과를 가지고 있지만, 그것은 여전히"통계 모델링"기술일 뿐이며, 데이터 중의 통계 법칙을 학습하여 관련 임무를 완수하는 것은 본질적으로 진정으로 이해와 추리 능력을 가진 것이 아니라고 생각한다.
양리쿤 자신은 차세대 인공지능 시스템을 개발하기 위해 노력하고 있다. 그는 이 시스템이 인간의 지능 수준을 갖춘 기계에 동력을 제공하여 기계에서'슈퍼 지능'을 창조할 수 있기를 희망한다.그러나 그는 이 비전이 실현되기까지 10년이 걸릴 수 있다고 지적했다.
"세계 모델링" 방법
양리쿤은 메타의 기초 인공지능 연구(Fair) 실험실에서 약 500명의 팀을 관리하고 있다.그들은'상식'을 형성할 수 있는 인공지능을 만들고 인간과 비슷한 방식으로 세계의 작동 방식을 관찰하고 체험하며 학습해 궁극적으로'세계 모델링'이라고 불리는 범용 인공지능(AGI)을 실현하기 위해 노력하고 있다.
2022년, 양립곤은 처음으로"세계모델링"비전에 관한 론문을 발표했는데 그후 메타는 이 방법을 바탕으로 두가지 연구모형을 발표했다.
양립곤은 최근 다음과 같이 지적했다.Fair 실험실은 인공 지능이 궁극적으로 인간의 지적 수준에 도달 할 수있도록하기 위해 다양한 아이디어를 테스트하고 있지만,"이 중에는 많은 불확실성과 탐구가 있으며, 우리는 또한 어느 것이 성공할 것인지, 어느 것이 최종적으로 선택 될 것인지를 판단할 수 없다"고 말했다.
또 "우리는 차세대 인공지능 시스템의 풍랑에 처해 있다"고 굳게 주장했다.
내부 갈등
그러나 이 과학자의 실험적 비전은 현재 투자자들이 인공지능 투자의 빠른 수익을 더 원하기 때문에 메타사에 값비싼 도박이다.
그래서메타 사내에서도'단기 수입'과'장기 가치'사이에 대한 견해차가 나타나고 있다.이 같은 이견은 지난해 GenAI 팀 출범을 보면 알 수 있다.
메타는 2013년 인공지능 연구 분야를 개척하기 위해 페어 랩을 설립했으며 이 분야 최고 학자들을 영입했다.하지만 2023년에는Meta는 Fair 실험실에서 많은 인공 지능 연구자와 엔지니어를 영입하고 Llama 3 모델의 작업을 이끌었으며 새로운 인공 지능 어시스턴트와 이미지 생성 도구와 같은 제품에 통합한 Chris Cox 최고 제품 책임자가 이끄는 새로운 GenAI 팀을 따로 그었습니다.
일부 내부 인사들은GenAI 팀의 설립은 아마도 양리쿤과 메타 최고 행정관 저커버그 두 사람이 이념적으로 어떤 모순이 있기 때문일 것이다.저커버그는 투자자들의 압력과 수익 압력 속에서 인공지능의 더 많은 상업화 응용을 추진해 왔다;반면 페어랩 내부의 학원파 문화는 메타를 생성식 인공지능 열풍에서 약간'약세'를 보이고 있다.
양립곤이 이 관점을 발표할 때메타와 경쟁사들은 지난주 OpenAI가 발표한 더 빠른 GPT-4o 모델을 포함한 더 많은 향상된 버전의 대형 언어 모델을 추진하고 있다;구글은 새로운'다중 모드'AI 어시스턴트 Project Astra를 출시했습니다.메타는 지난달 최신 Llama 3 모델도 선보였다.
이러한 최신 대형 언어 모델에 대해 양리쿤은 거들떠보지도 않는다. 그는"대형 언어 모델의 이러한 진화는 천박하고 제한되어 있다. 인간 엔지니어가 개입하여 이러한 정보에 근거하여 훈련할 때만 모델이 학습할 수 있다. 인간처럼 자연스럽게 결론을 내리는 것이 아니다."이는 자신의 Llama 모델의 얼굴을 때리는 것과 같다.
비록 관념적으로 모순이 존재하지만 한 소식통에 따르면 양립곤은 여전히 저커버그의 핵심고문중의 하나이다. 왜냐하면 그는 인공지능분야에서 극히 큰 명성을 갖고있기때문이다.

대언어 모델은 AI의'끝'이 아니다?메타 수석 과학자: 여전히 인간의 지혜를 따라갈 수 없다

知乎周源：AI駆動の下で「IoT万物相互接続」が「IoA万物知能相互接続」にアップグレードされる

スターバックスは、中国事業の株式売却を検討しているとの噂に応える：中国市場での長期的な発展に努め、最適な成長ルートを探す

伊仏半導体CEO：中国市場は華虹との提携が非常に重要

ナスダック中国の金龍指数は1%下落人気の中概株が多数下落