グーグル「Her」フライング着地OpenAI音声AIは「ホールドオン」のまま
SOGO
发表于 2024-8-14 20:39:30
192
0
0
北京時間8月14日未明、グーグルは「Made by Google」大会でスマート音声アシスタントのGemini Liveを正式に発表した。この機能はOpenAIのGPT-4 o音声モードに直接挑戦し、人工知能のインタラクションがより自然で汎用的でユーザーフレンドリーな方向にまた一歩前進したことを示している。
グーグルによると、ユーザーは従来の入出力設定ではなく、Gemini Liveと自由で滑らかな会話ができる。
会話中に、ユーザーは詳細を問い合わせるために中断したり、しばらく中断してから続行したりすることができます。
会話をより自然にするために、Googleはユーザーが選択できるように10種類の音声を提供しています。グーグルは、「ポケットにパートナーがいるように、新しいアイデアを話したり、重要な会話を練習したりすることができます」と話しています。
Open AIがこれまでに発表したGPT-4 oの高度な音声モデルは、ユーザーが会話中に中断し、ユーザーの感情の変動を感知し、応答することもできるようにしている。音声設定では、Open AIは4種類の音声を提供し、いずれもプロの声優と協力して制作している。
また、グーグルはGemini Liveを他のアプリケーションやツールに接続している。グーグルは、Keep、Tasks、Utilities、Calendar、YouTube Musicなどの拡張機能を今後数週間で提供すると発表した。
グーグルはこれらの機能の具体的な応用シーンを説明した。例えば、ユーザーはGemini Liveに特定のレシピを見つけさせ、Keepショッピングリストに食材を追加し、「90年代末を思い出させる」歌のリストをカスタマイズすることができるディナーを開催する必要があります。例えばコンサートのポスターの写真を1枚撮るだけで、Gemini Liveは当日空いているかどうかを答え、チケットを買うようにユーザーに注意することができます。
しかし、「Made by Google」大会でGemini Live機能を実演したところ、ちょっとしたエピソードが登場した。グーグルの幹部Dave Citron氏は、Gemini Liveのスケジュールにイベントがあるかどうかを尋ね、2回続けてGemini Liveを試みたが応答せず、3回目にデバイスを交換してからプレゼンテーションに成功した。
グーグルは現在、Android携帯電話のGeminiプレミアム購読者に英語版を提供しており、今後数週間以内にiOSに拡張しながら、より多くの言語モデルを提供する。グーグルが発表した最新のPixel 9シリーズの携帯電話にもGemini Live機能が搭載されている。
業界関係者は、Gemini Liveのリリースは人工知能のインタラクション発展の重要なマイルストーンだと考えている。音声中断と選択機能を導入することで、グーグルはOpenAIと競争するだけでなく、人間とのインタラクションを推進する方法でもある。これにより、人工知能チャットロボット市場の競争構造を変え、他社により多くの自然、実用、魅力的な人工知能の助力を創出させることができる。
同時に、ヒューマン・インタラクションの革新的な発展も新たな問題と挑戦をもたらした。たとえば、人工知能はコンテキストの統一性と相関性を維持しながらトピックの変化を迅速に処理するにはどうすればよいのでしょうか。重要な手がかりを失わずに干渉情報を処理する方法さらに重要なのは、人工知能が深く発展するにつれて、現実生活との境界はどこにあるのだろうか。
OpenAIが3カ月前から公開紹介してきたGPT-4 oは、まだ完全に着地していない。8月9日、OpenAIはセキュリティに関するブログ記事を発表し、GPT-4 oを開発する際に同社が行ったセキュリティへの取り組みを詳細に紹介し、これらの技術が社会にもたらす可能性のあるリスクを検討した。
OpenAIはこの報告書で、人工知能の類人社交モデルによるリスクを指摘している。OpenAIは、ユーザーが人工知能と社交関係を構築し、人間の相互作用に対する需要を減らす可能性があると考えている。これは孤独な個体に有利ですが、健康な人間関係に影響を与えます。
OpenAIによると、GPT-4 oの初期テスト時には、ユーザーとモデルのインタラクティブな言語に微妙な変化が現れ始めていることが観察された。例えば、「これは私たちが一緒にいる最後の日だ」など、無害に見える表現の背後にはより大きな問題が隠されている可能性がある。
また、OpenAIは、GPT-4 oが意図せずにユーザーの声を模倣した出力を生成することがあると述べ、AI音声エンジンが詐欺に使われる可能性があることを意味している。
これらのセキュリティ問題は、OpenAIがGPT-4 oの着地リズムを制御する原因の1つでもある。グーグルのGemini Liveが同様のセキュリティ上の危険性を解決したかどうかについては、明らかにしていない。
安全に関連するすべての隠れた危険性は、私たちが認識できることも、「パンドラの箱」に付属するより多くの可能性も、人工知能事業が「技術の進歩は人間に奉仕するため」であることを保証するためにさらに解決しなければならない問題である。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- 구글"Her"가 앞다투어 착지하는 OpenAI 음성AI는 여전히"hold on"에 있다
- 突发!高管离职、计划重组!OpenAI怎么了?
- 苹果公司据悉不再参与OpenAI融资轮谈判
- Apple reportedly no longer participates in OpenAI funding round negotiations
- アップルはOpenAI融資ラウンド交渉に参加しないという
- 애플은 OpenAI 융자 라운드 협상에 더 이상 참여하지 않는 것으로 알려졌다
- OpenAI称收到英伟达DGX B200工程机
- OpenAI claims to have received the NVIDIA DGX B200 engineering machine
- OpenAI는 엔비디아 DGX B200 공정기를 받았다고 한다
-
【英偉達の需要が高すぎる?SKハイニックス:黄仁勲がHBM 4チップの6カ月前納入を要求!】SKハイニックスの崔泰源(チェ・テウォン)会長は月曜日、インビダーの黄仁勲(ファン・インフン)CEOが同社の次世代高帯域 ...
- 琳271
- 前天 17:54
- 支持
- 反对
- 回复
- 收藏
-
ファイザーが前立腺がんを治療する革新薬テゼナ& ;reg;(TALZENNA®,一般名:トルエンスルホン酸タラゾールパーリカプセル)は2024年10月29日に国家薬品監督管理局(NMPA)の承認を得て、HRR遺伝子突然変異 ...
- 什么大师特
- 昨天 17:41
- 支持
- 反对
- 回复
- 收藏
-
南方財経は11月5日、中央テレビのニュースによると、現地時間11月5日、米ボーイング社のストライキ労働者が59%の投票結果で新たな賃金協定を受け入れ、7週間にわたるストライキを終えた。ストライキ労働者は11月12 ...
- Dubssgshbsbdhd
- 昨天 16:27
- 支持
- 反对
- 回复
- 收藏
-
【マスクはテスラが携帯電話を作ることに応えた:作れるが作らないアップルとグーグルが悪さをしない限り】現地時間11月5日、有名ポッドキャストのジョローガン氏のインタビューに応じ、「携帯電話を作るのは私たち ...
- 波大老师
- 昨天 14:41
- 支持
- 反对
- 回复
- 收藏