グーグル「Her」フライング着地OpenAI音声AIは「ホールドオン」のまま
SOGO
发表于 2024-8-14 20:39:30
202
0
0
北京時間8月14日未明、グーグルは「Made by Google」大会でスマート音声アシスタントのGemini Liveを正式に発表した。この機能はOpenAIのGPT-4 o音声モードに直接挑戦し、人工知能のインタラクションがより自然で汎用的でユーザーフレンドリーな方向にまた一歩前進したことを示している。
グーグルによると、ユーザーは従来の入出力設定ではなく、Gemini Liveと自由で滑らかな会話ができる。
会話中に、ユーザーは詳細を問い合わせるために中断したり、しばらく中断してから続行したりすることができます。
会話をより自然にするために、Googleはユーザーが選択できるように10種類の音声を提供しています。グーグルは、「ポケットにパートナーがいるように、新しいアイデアを話したり、重要な会話を練習したりすることができます」と話しています。
Open AIがこれまでに発表したGPT-4 oの高度な音声モデルは、ユーザーが会話中に中断し、ユーザーの感情の変動を感知し、応答することもできるようにしている。音声設定では、Open AIは4種類の音声を提供し、いずれもプロの声優と協力して制作している。
また、グーグルはGemini Liveを他のアプリケーションやツールに接続している。グーグルは、Keep、Tasks、Utilities、Calendar、YouTube Musicなどの拡張機能を今後数週間で提供すると発表した。
グーグルはこれらの機能の具体的な応用シーンを説明した。例えば、ユーザーはGemini Liveに特定のレシピを見つけさせ、Keepショッピングリストに食材を追加し、「90年代末を思い出させる」歌のリストをカスタマイズすることができるディナーを開催する必要があります。例えばコンサートのポスターの写真を1枚撮るだけで、Gemini Liveは当日空いているかどうかを答え、チケットを買うようにユーザーに注意することができます。
しかし、「Made by Google」大会でGemini Live機能を実演したところ、ちょっとしたエピソードが登場した。グーグルの幹部Dave Citron氏は、Gemini Liveのスケジュールにイベントがあるかどうかを尋ね、2回続けてGemini Liveを試みたが応答せず、3回目にデバイスを交換してからプレゼンテーションに成功した。
グーグルは現在、Android携帯電話のGeminiプレミアム購読者に英語版を提供しており、今後数週間以内にiOSに拡張しながら、より多くの言語モデルを提供する。グーグルが発表した最新のPixel 9シリーズの携帯電話にもGemini Live機能が搭載されている。
業界関係者は、Gemini Liveのリリースは人工知能のインタラクション発展の重要なマイルストーンだと考えている。音声中断と選択機能を導入することで、グーグルはOpenAIと競争するだけでなく、人間とのインタラクションを推進する方法でもある。これにより、人工知能チャットロボット市場の競争構造を変え、他社により多くの自然、実用、魅力的な人工知能の助力を創出させることができる。
同時に、ヒューマン・インタラクションの革新的な発展も新たな問題と挑戦をもたらした。たとえば、人工知能はコンテキストの統一性と相関性を維持しながらトピックの変化を迅速に処理するにはどうすればよいのでしょうか。重要な手がかりを失わずに干渉情報を処理する方法さらに重要なのは、人工知能が深く発展するにつれて、現実生活との境界はどこにあるのだろうか。
OpenAIが3カ月前から公開紹介してきたGPT-4 oは、まだ完全に着地していない。8月9日、OpenAIはセキュリティに関するブログ記事を発表し、GPT-4 oを開発する際に同社が行ったセキュリティへの取り組みを詳細に紹介し、これらの技術が社会にもたらす可能性のあるリスクを検討した。
OpenAIはこの報告書で、人工知能の類人社交モデルによるリスクを指摘している。OpenAIは、ユーザーが人工知能と社交関係を構築し、人間の相互作用に対する需要を減らす可能性があると考えている。これは孤独な個体に有利ですが、健康な人間関係に影響を与えます。
OpenAIによると、GPT-4 oの初期テスト時には、ユーザーとモデルのインタラクティブな言語に微妙な変化が現れ始めていることが観察された。例えば、「これは私たちが一緒にいる最後の日だ」など、無害に見える表現の背後にはより大きな問題が隠されている可能性がある。
また、OpenAIは、GPT-4 oが意図せずにユーザーの声を模倣した出力を生成することがあると述べ、AI音声エンジンが詐欺に使われる可能性があることを意味している。
これらのセキュリティ問題は、OpenAIがGPT-4 oの着地リズムを制御する原因の1つでもある。グーグルのGemini Liveが同様のセキュリティ上の危険性を解決したかどうかについては、明らかにしていない。
安全に関連するすべての隠れた危険性は、私たちが認識できることも、「パンドラの箱」に付属するより多くの可能性も、人工知能事業が「技術の進歩は人間に奉仕するため」であることを保証するためにさらに解決しなければならない問題である。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- Apple reportedly no longer participates in OpenAI funding round negotiations
- アップルはOpenAI融資ラウンド交渉に参加しないという
- 애플은 OpenAI 융자 라운드 협상에 더 이상 참여하지 않는 것으로 알려졌다
- OpenAI称收到英伟达DGX B200工程机
- OpenAI claims to have received the NVIDIA DGX B200 engineering machine
- OpenAI는 엔비디아 DGX B200 공정기를 받았다고 한다
- 谷歌可能被迫出售Chrome,OpenAI考虑推出浏览器
- Google may be forced to sell Chrome, OpenAI considers launching browser
- グーグルがChromeの売却を迫られる可能性、OpenAIがブラウザの発売を検討
- 구글은 크롬을 판매해야 할 수도 있고, OpenAI는 브라우저 출시를 고려하고 있다
-
アリババは、26億5000万ドルのドル建て優先無担保手形と170億元の人民元建て優先無担保手形の定価を発表した。ドル債の発行は2024年11月26日に終了する予定です。人民元債券の発行は2024年11月28日に終了する予定だ ...
- SOGO
- 前天 09:05
- 支持
- 反对
- 回复
- 收藏
-
スターバックスが中国事業の株式売却の可能性を検討していることが明らかになった。 11月21日、外国メディアによると、スターバックスは中国事業の株式売却を検討している。関係者によると、スターバックスは中国事 ...
- 献世八宝掌
- 昨天 16:29
- 支持
- 反对
- 回复
- 收藏
-
【意法半導体CEO:中国市場は非常に重要で華虹と協力を展開】北京時間11月21日、意法半導体(STM.N)は投資家活動の現場で、同社が中国ウェハー代工場の華虹公司(688347.SH)と協力していると発表した。伊仏半導体 ...
- 黄俊琼
- 昨天 14:29
- 支持
- 反对
- 回复
- 收藏
-
【ナスダック中国金龍指数は1%下落した。人気の中概株の多くは下落した】現地時間11月21日、ナスダック中国金龍指数は1%下落し、人気の中概株の多くは下落し、必死に10%超下落し、愛奇芸は7%超下落し、百度は6%近く ...
- 比尔992
- 2 小时前
- 支持
- 反对
- 回复
- 收藏