首页 신문 正文

언론 보도에 따르면 OpenAI는 코드 작성, 여행 예약, 자동 전자상거래 쇼핑 등 다양한 복잡한 작업을 자동으로 수행할 수 있는'Operator'라는 이름의 새로운 AI 어시스턴트 제품을 출시할 준비를 하고 있다.내부 직원의 폭로에 따르면 OpenAI 지도부는 2025년 1월에 이 제품을 발표하여 먼저 연구 프리뷰와 개발 도구로 출시할 예정이며, 그 때 개발자에게 API 인터페이스를 개방할 것이다.
OpenAI는 지능체와 관련된 몇 가지 연구 프로젝트를 진행해 왔다고 이 신문은 전했다.이 중 한 인사는 가장 가까운 것은 웹 브라우저에서 작업을 수행하는 일반적인 도구가 될 것이라고 말했다.
AI 어시스턴트 (AI Agent) 는 환경을 감지하고 의사결정과 동작을 수행할 수 있는 스마트 실체로, 독립적인 사고, 도구 호출을 통해 주어진 목표를 점진적으로 완수할 수 있는 능력을 갖추고 있으며, C단에 개성화된 응용을 제공할 수 있을 뿐만 아니라 B단에도 원가절감과 효율증대 방안을 제공할 수 있다.일반 사용자에게 AI 보조의 가장 핵심적인 기능은 AI가 스스로 휴대전화를 조작하고 복잡한 추리 임무를 보조하는 것이다.
OpenAI 최고경영자 알트만은 이미 다음 의사를 밝혔다.그는 몇 주 전 레딧의'무엇이든 물어보세요'(Ask Me Anything) 포럼에서 "우리는 점점 더 좋은 모델을 갖게 될 것이지만, 다음 중대한 돌파구는 AI 어시스턴트가 될 것이라고 생각한다"고 말했다. 지난달 회사 연례 개발일 이전 오픈AI 기자회견에서 케빈 위일 최고제품책임자는 "2025년이 에이전트 시스템이 최종적으로 주류에 진입하는 해가 될 것으로 생각한다"고 말했다.
OpenAI의 관점에서 볼 때, 상업화 과정에서 점점 더 큰 압력에 직면하고 있으며, ChatGPT의 점진적인 개선은 사용자들이 더 높은 가격을 지불하도록 끌어들이지 못할 수도 있다.임원들은 AI 개발에 막대한 투자가 가치가 있다는 것을 증명하기 위해 획기적인 제품이 절실히 필요하다.
현재 OpenAI는 다기능 협동 AI Agent인 Swarm을 오픈소스로 하여 여러 지능체 협동 작업을 생성하여 더욱 효율적으로 작업을 수행할 수 있다.그 GPT o1 모델은 추리력을 강화하여 복잡한 문제의 해결과 사용자 인터렉션의 자연성 방면에서 모두 현저한 진보를 가져왔으며, 또한 AI Agent 장면에 더욱 적합하게 만들었다.
AI 어시스턴트는 AGI로 가는 핵심 기반으로 간주되며, 하드웨어 업체들이 AI라고 언필칭하는 시대에 AI 어시스턴트는 단말기 지능화의 돌파구가 될 수도 있다.용흥증권은 다음과 같이 표시했다. AI Agent는 이동인터넷의 새로운 입구를 장악하게 되며 류량분배구도는 AI Agent 지능체가 비교적 강한 상호작용성 및 편리성을 구비하였거나 원래 같은 단말기의 부동한 App간의 천연장벽을 뚫을수 있다.
"과학창업판일보" 의 불완전한 정리에 따르면 국내외 머리제조업체들은 앞다투어 AI보조제품을 출시하고있다.
마이크로소프트는 최근 AI 도구인 OmniParser를 조용히 오픈소스화했는데, 이는 사용자가 개인용 컴퓨터를 조작하기 위해 개성화된 지능체를 만드는 데 도움을 줄 수 있다;10월 22일, 마이크로소프트는 Dynamics 365에 10개의 자체 AI Agent를 통합하여 OpenAI 최신 모델 o1을 지원하고 자체 학습 능력을 갖추어 플랫폼 간 복잡한 업무를 자동으로 수행할 수 있다고 발표했다;9월에 Microsoft는 AI 어시스턴트 개발 범주에 속하는 Windows Agent Arena라는 벤치마크 프레임워크를 출시했습니다.
더 인포메이션에 따르면 구글은 12월에'연구 수집, 제품 구매 또는 항공편 예약'과 같은 작업을 수행할 수 있도록 돕는 대형 액션 모델'프로젝트 자비스'를 미리 볼 계획이다.
10월 22일, Anthropic은 대형 모델 Claude를 위해 AI가 사람처럼 컴퓨터를 조작할 수 있도록 새로운 기능인 Computer Use를 반복했다.Claude3.5 Sonnet은 커서 이동, 버튼 클릭 및 텍스트 입력을 포함하여 컴퓨터 제어를 지원하는 최초의 모델입니다.
애플은 시리와 ChatGPT를 통합하여 더 스마트한 휴먼 컴퓨터 인터렉션을 실현하기로 선택했고, 또 다른 네티즌들은 애플이 이미 묵묵히 Ferret-UI의 두 가지 구현 버전 (각각 Gemma 2B와 Llama 8B 기반) 을 발표했다는 것을 발견했다. 이는 애플이 지난 5월 발표한 AI가 휴대전화 화면을 이해할 수 있는 기술이다.
화웨이는 AI가 인간처럼 휴대전화를 조작할 수 있는 새로운 연구 성과를 발표했다. 관련 팀은 Lightweight Multi-modal App Control (경량급 다중모드 응용 제어, 약칭 LiMAC) 이라는 휴대전화 제어 구조를 제시했다.
중국 유니콘 기업 지보 AI는 이미 AI 보조 도구인 AutoGLM을 오픈했다. 수동으로 조작할 필요가 없다. 사용자가 휴대폰에 대해 말하면 (지령을 내리면) 자동으로 휴대폰의 각종 App을 열고 인터넷 쇼핑, 배달 주문, 고속철 티켓 예약, 심지어 위챗 발송, 홍바오 빼앗기, 모멘트 평가, 필기 정리 및 공략 생성, 논문 총결을 진행할 수 있다.
중신증권은 AutoGLM 등 단말기 AI 보조 기술은 더 짧은 경로의 인터렉션 형식을 가져올 것이며, 음성 지령을 받고 자동으로 복잡한 조작을 완성하는 능력은 소비자에게 큰 편리를 가져다 줄 것이며, 이는 AI 단말기의 하이라이트 기능이 되고 소비자의 업그레이드와 세대교체를 끌어들일 수 있을 것이라고 밝혔다.
화타이증권도 AI 보조 착지는 여러 차원의 산업 기회를 가져올 것이며, 그 중 Agent + 단말기는 휴먼 컴퓨터 인터렉션 변혁을 추진할 것으로 기대되며, 단말기 판매량 가격 방면의 변화 외에 단말기 응용의 비즈니스 모델에 더욱 심원한 영향을 미칠 수 있다고 밝혔다.
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

hsbt 新手上路
  • 粉丝

    0

  • 关注

    0

  • 主题

    0