|
기술 공유일 6일, OpenAI는"본심"에 더 가까운 것을 제공합니다. ChatGPT는 실시간 영상 통화, 화면 공유 및 이미지 업로드라는 고급 음성 모드를 시작합니다.
왜'본심'에 가깝다고 하죠?
OpenAI CEO Altman은 앞서 Salesforce와의 인터뷰에서 자신이 가장 좋아하는 AI 영화는'그녀'(Her, 한 남자가 그의 AI 가상 어시스턴트를 사랑하게 된 이야기)라며 "대화 언어 인터페이스의 생각은 믿을 수 없는 예견성을 가지고 있다"고 밝혔다. The Information은 보도에서 Altman이 영화의 AI 어시스턴트처럼 빠르게 응답할 수 있는 가상 어시스턴트를 최종적으로 개발하기를 희망한다고 밝혔다.
"Her" 의 로봇 여자친구는 구신지능의 궁극적인 형태를 대표하며 사람과 무장애 상호작용을 할 수 있다.
이전에 ChatGPT의 DAN 모드 (Do anything now의 약칭) 는 AI가 더욱 자유로운 방식으로 사용자와 대화할 수 있도록 허용했는데, 그'인간미'의 무게는 이미 사람을 놀라게 했다. 낮은 의사소통은 물론 인간의 말투를 모방하고 정서적 가치를 제공할 수 있다.이번에 ChatGPT는 말을 들을 수 있을 뿐만 아니라 시각 능력도 잠금 해제해 카메라를 통해'눈을 뜨고 세상을 본다'.
이번 공유 생방송에는 CEO 샘 알트먼이 등장하지 않고 OpenAI의 최고제품책임자 케빈 웨일, OpenAI 제품매니저 재키 섀넌, 다중모드를 담당하는 OpenAI 기술팀 멤버 미셸 퀸과 로완 젤러스를 포함한 네 명의 직원이 업데이트된 기능을 소개했다.
고급 음성 모드의 실시간 영상 통화 기능이 가장 돋보인다.OpenAI의 팀원들이 차례로 ChatGPT 동영상과 인사를 나누고 어느 정도 알게 되자 순록 뿔을 가진 동료의 이름이 무엇이냐는 질문이 나왔다.챗GPT는 산타클로스 한정 음성으로 정답을 제시해'기억'능력을 보여줬다.
다음으로 팀은 ChatGPT가 어떻게 사람들에게 핸드드립 커피 장비를 조작하도록 가르치는지 시연했다. ChatGPT에"영상통화"를 한 통만 하면 된다. 그것은 당신 앞의 기구에 따라 손수 모든 단계를 완성할 수 있다.전체 시연 과정에서 ChatGPT의 목소리는 자연스럽고 친절했으며 인간처럼 크게 웃을 정도로 말투도 조정했다.
화면 공유 기능은 화면 공유 방식을 통해 ChatGPT로 하여금 당신의 화면을"보게"하는 것이며, 또한 실시간 비디오 이해 능력이다.사용자는 오른쪽 하단의 고급 음성 모드 아이콘을 클릭하고 드롭다운 메뉴에서 공유 화면을 선택하면 맞춤형 도움을 받을 수 있다.
OpenAI 팀원들은 공유에 성공한 후 ChatGPT가 자신의 문자 메시지를 탐색하고 답장을 지도할 것을 요구했고, ChatGPT는"높은 감성"의 일면을 보여주며 상대방의 크리스마스 장식을 칭찬할 것을 제안했다.
소개에 따르면 고급음성모식은 50개 이상의 언어, 9개의 사실적인 출력음성옵션을 지원하며 각 음성은 모두 자신의 독특한 어조와 특징을 갖고있다.그 배후의 GPT-4o는 음성을 텍스트로 변환할 수 있을 뿐만 아니라 호흡과 감정과 같은 오디오의 다른 기능도 이해하고 표시할 수 있다.
50여개 언어를 지원하는 ChatGPT는 현실세계의 장면을 실시간으로 리해할수 있어 ChatGPT가 AI 동반도구로서의 체험감을 대폭 제고시켰을뿐만아니라 더욱 능률적이고 강력한 AI 교육도구를 위해 시범을 보였다.
이 기능은 오늘부터 ChatGPT 모바일 앱에서 출시되며 앞으로 일주일 동안 모든 팀 사용자와 대부분의 Plus 및 Pro 사용자에게 개방됩니다. |
|