"100모드대전" 주년시험 경쟁AI 응용: OpenAI, 구글"힘겨루기"지능조수 Kimi, 믹타 련이어"출권"

lwj2006 · 发表于 2024-5-17 17:45:47

기세등등한"백모대전"을 수반하는것은 중복성건설의 쟁의와 상업현금화의 난제이다.최초의 열풍이 사라지면서 일부 투자자들은 대형 모델에 대해서도 냉정기에 접어들었다.AI 네이티브 애플리케이션은 거대 기술 기업들이 선호하는 새로운'바람막이'가 되고 있다.
5월 13일 (현지 시간) OpenAI는 차세대 AI 대형 모델 GPT-4o가 지원하는 ChatGPT 스마트 어시스턴트를 발표했다. 인터렉션 능력은 실물에 비견된다.하루 뒤 구글도 시각인식과 음성 인터렉션 제품인 프로젝트 아스트라를 출시하고 검색 도구를 위한 AI 개요 (AI Overview) 기능을 선보여 사용자가 검색 상자에 문제를 입력하면 AI가 정리한 답을 얻을 수 있다.
스타 투자자 주소호는 큰 모델에서 부가가치 서비스를 할 기회가 많다며"응용층은 많은 혁신이 있다. 중국은 데이터와 응용 장면에서 미국을 훨씬 능가한다"고 말했다."
영노엔젤펀드 동업자 왕성도 매일경제신문 기자와의 인터뷰에서 이에 공감했다.그는 "앱에서 큰 기회가 생긴다"며 "가장 큰 플랫폼은 결국 사용자의 요구에 의해 움직이는 앱 플랫폼이라고 생각한다"고 말했다.
오픈AI와 구글의 빅액션에 앞서 믹타 AI 검색과 달의 어두운 면의 키미 스마트 어시스턴트는 이미 잇따라'동그라미'를 치며 AI 응용의 넓은 시장 공간을 시장에 보여줬다.업계에서는 2024년이 AI 활용 혁신의 원년이 될 것이라는 견해까지 나온다.이에 대해 왕성은 큰 모델 능력, 도구 체인 능력, 비용 측면에서 아직 부족하며 AI 응용의 폭발은"아직 시간이 되지 않았다"고 회의적인 태도를 보였다.
실리콘 밸리"새로운 경기장": OpenAI, 구글 대"볼륨"스마트 어시스턴트
"100모델 대전"행에서 현재까지, 점점 더 많은 업계 인사들은 AI의 미래 경쟁 고지는 큰 모델 자체가 아니라 천행백업의 원생 응용에 착지하고 있다고 생각한다.강력한 대형 모델을 기반으로 실리콘 밸리의 거대 기술 기업들은 더 인간적이고 강력한 생성식 AI 도구를 개발하는 데 주력하고 있다.
5월 13일 (현지 시간) OpenAI는 봄 발표회를 열고 차세대 AI 대형 모델 GPT-4o를 발표했다. 번호 속의 알파벳"o"는"omni"(만능) 를 대표한다. 텍스트, 오디오, 이미지의 임의의 조합 입력을 받아들일 수 있을 뿐만 아니라 텍스트, 오디오, 이미지의 관련 응답도 생성할 수 있다.
생방송 시연에서 GPT-4o가 지원하는 ChatGPT는 이미지를 번역하고 식별하며 토론을 벌일 뿐만 아니라 눈치를 살피고 농담과 얼굴 붉히는 척을 할 뿐만 아니라 방해에 대처하는 방법을 알고 유창한 대화 수준을 보여주며 대화가 거의 지연되지 않고 인터렉션 능력이 실물에 비견된다.
Wire는 이러한 조정이 ChatGPT를 더욱 매력적으로 만들 수 있다고 보도했다.오픈AI CEO 알트만은 "영화 속 AI처럼 사실적이어서 솔직히 좀 놀랐다"며 "인간에 가까운 반응 속도와 표현 능력에 도달한 것은 중대한 돌파구"라고 직언했다.
OpenAI는 향후 몇 주 내에 API에서 GPT-4o의 새로운 오디오 및 비디오 기능을 일부 파트너에게 개방할 계획이다.
GPT-4o가 발표된 다음 날, 구글의 연례 개발자 대회도 약속대로 개최되었고, 10여 개의 제품이 연이어 발표되었다: 다중 모드 AI 모델인 Gemini 1.5 Pro, 문생도 모델인 Imagen 3와 문생영상 모델인 Veo 외에도 구글은 시각인식과 음성인터렉션 제품인 Project Astra를 출시하였다.
Astra는 휴대전화 카메라를 켜고 임의의 물건에 맞추기만 하면 물건의 이름을 정확하게 말할 수 있고,"렌즈 속 무엇이 소리를 낼 수 있는가"와 같은 질문에도 대답할 수 있다.
시연에서 볼 때 Astra의 대화 지연은 GPT-4o보다 좀 길고 질문을 받은 후 일정한 반응 시간이 있지만 마찬가지로 다중모드적 이해와 실시간 대화 능력을 갖추고 있다.
또한 구글은 자사의 검색 도구를 위해 AI 개요 (AI Overview) 기능을 출시하여 사용자가 검색 상자에 문제를 입력하면 AI가 정리한 답을 얻을 수 있고 초장기 문제를 처리할 수 있다.
오픈AI와 구글 외에도 실리콘밸리 기업가 일론 머스크, 기술기업'딥마인드'창업자 중 한 명인 무스타파 술레이먼도 각각 챗봇 그로크와 피에 투자해 의인화 특징을 제품 주공격 방향으로 삼았다.
"응용에는 큰 기회가 있다": 국내에서는 이미 두마리의"다크호스"가 뛰여나왔다
치타모바일 회장 겸 CEO 푸성은 만약 원가를 따지지 않고 매개변수를 중첩하여 이른바 큰 모형능력을 제고한다면 이 길은 틀림없이 어려움을 겪게 될것이라고 인정했다.OpenAI가 GPT-4o 모델 응용을 발표한 것은 큰 모델이 응용 차원에서 매우 유망하다는 것을 설명하고 있다. 큰 모델의 능력은 끊임없이 반복될 것이다. 그러나 최종적으로 큰 모델을 잘 사용할 수 있는 것은 역시 응용이다.
최근 믹타 AI 검색과 월의 암면의 국내 화재도 AI 응용의 넓은 공간을 충분히 보여준다.
'AI 제품 차트(aicpb.com)'통계에 따르면 달의 어두운 면의 키미 스마트 어시스턴트는 지난 4월 방문자 수가 2004만명으로 전월 대비 60.2%, 전월 대비 321.58% 증가했다.3월 전월 대비 551.36% 증가한 데 이어 국산 AI 애플리케이션인 믹타 AI 검색의 지난 4월 방문자 수가 증가세를 이어가며 전월 대비 54.56% 오른 1086만명을 기록했다.
이에 앞서 바이두도 단숨에 20개가 넘는 AI 네이티브 애플리케이션을 발표했습니다.바이트댄스는 새로운 팀을 만들어 응용층을 주공격했습니다.텐센트는 큰 모델을 작은 프로그램에 내장했습니다.알리도 통의천문으로 모든 응용을 다시 한번 해야 한다.
왕성 영노엔젤펀드 파트너는 매일경제신문 기자와의 인터뷰에서"앱에서 큰 기회가 생긴다.가장 큰 플랫폼은 결국 사용자 수요에 의해 구동되는 앱 플랫폼이라고 생각한다"고 말했다.
스타 투자자 주소호도 국내의 응용층 혁신을 매우 긍정적으로 보고 있다. 그가 보기에 국내 혁신의 가장 큰 저력은"데이터와 응용 장면에서 미국을 훨씬 능가한다."
선택 방법: To B 또는 To C?
대량의 핫머니와 인재가 대형 모델 응용 분야에 집중을 가속화할 때, 기업의 선택도 분화되기 시작한다: 일부 예를 들면 믹타 테크놀로지는 C단을 대상으로 하는 동시에 B단 고객의 커버리지를 강화하고 있고, 다른 일부 예를 들면 달의 어두운 면은 To C를 선택한다.
사용자 규모에서 믹타 테크놀로지의 COO 왕익은 작년 11월 언론에 믹타가 C단 등록 사용자를 통해 B단 사용자를 접촉했으며, 그때 이미 인터넷 대공장, 유명 미디어 등을 포함한 수천 개의 B단 고객이 있었다고 밝혔다.
전 마이크로소프트 글로벌 부총재 강대흔이 설립한 국내 대형 모델 스타트업 계단성신은 목표를 주로 C단에 집중했다.
"우리는 전통적인 의미의 To B를 하지 않기로 선택했다. To C에 초점을 맞출 것이다."라고 스텝스신 측은 매일경제신문 기자에게 말했다."큰 각도에서 말하자면, 우리는 현재 모델에 더 많은 초점을 맞추고 있다.제품은 우리가 분명히 할 것이다. 하나는 우리가 모델의 발전을 견인할 제품이 필요하고, 둘째는 제품의 데이터가 우리의 모델을 반포하는 것이다.어떤 제품을 만들 것인가?우선, 단계성신은 전통적인 맞춤화 모델에 사유화 배치와 같은 논리를 더하고 싶지 않다. 우리는 여전히 상대적으로 엘리트, 인재가 비교적 집중된 팀을 유지하고 싶다"고 말했다.
월의 암면은 매일경제신문 기자와의 인터뷰에서 To C를 확고히 하는 것은 모델 능력이 아직 빠르게 반복되고 있기 때문에 To B 제품을 만들면 대량의 인력과 물력 자원을 낭비하기 쉽다고 설명한 바 있다."국내 시장의 B단 제품은 종종 사유화 배치와 맞춤형 개발이 필요한데, 기존 모델의 어떤 버전을 기반으로 이렇게 배치와 개발을 진행하면 B단 제품의 능력과 사용자 체험이 모델 능력의 빠른 향상을 전혀 따라가지 못하고 곧 도태될 것이다."
AI 인프라층에 집중하는 스타트업 실리콘 기반 유동의 창업자 원진휘는 그렇게 보지 않는다.그는 매일경제신문 기자에게"현재로서는 To B 서비스를 하는 확실성이 더 높다"며"많은 기업들이 큰 모델을 이용해 다른 업종의 수직 서비스를 하고 있다"며"그들은 큰 모델의 미세 조정, 추리에 강한 수요를 갖고 있다"고 분석했다.
원진휘는 다음과 같이 인정했다. To C 응용의 성공의 불확실성은 더욱 높다. 적어도 국내에서는 아직 Midjourney, Character.ai와 같은 킬러급 응용을 보지 못했다."큰 모델 추리 배치의 비용이 더 낮아짐에 따라 To C 응용의 시도도 점점 더 많아지고 슈퍼 응용이 나타날 기회가 더 많아질 것이다.이에 비해 해외 시장의 2C 응용은 국내보다 빠르게 진행되고 있다"고 말했다.
그는 장기적으로 대형 모델 분야에서는 To C를 하든 To B를 하든 넓은 시장 공간이 있다고 강조했다.
2023년이 AI 대모델 원년이라면 업계에서는 2024년이 AI 적용 혁신의 해가 될 것이라는 목소리가 많다.
이 점에 대해 왕성은 인터뷰에서 회의적인 태도를 보였다.그는 대형 모델 능력, 도구 체인 능력, 비용 측면에서 아직 부족한 점을 감안할 때 AI 응용의 폭발은"아직 시간이 되지 않았다"고 말했다."마치 중국 시장에 있어서 위챗은 첫 번째 중요한 핸드폰 앱이지만, 그것이 등장했을 때 아이폰은 출시된 지 4년이 되었다."
응용을 창조하는 조건이 성숙하지 못한외에 왕성은 또 새로운 응용장면이 아직 발굴되지 않았으며 특히 초창기의 경우 더욱 그러하다고 지적했다."현재 많은 응용은 AI를 과거에 이미 있던 인터넷 업무 프로젝트에 응용하는 것이다. 과거 구산업의 큰 게이머들은 이 위에 고객, 돈, 데이터, 인재, 장면에 대한 이해 등 일련의 우세가 있다. 스타트업은 보완하기 어렵다.스타트업에게 핵심은 혁신이다. 기존 장면과 기존 사용자만 서비스하지 말고 새로운 수요와 사람들을 찾아야 한다"고 말했다.

用户名		自动登录	找回密码
密码			立即注册

"100모드대전" 주년시험 경쟁AI 응용: OpenAI, 구글"힘겨루기"지능조수 Kimi, 믹타 련이어"출권"

相关帖子