谷歌放出最强大模型狙击OpenAI 重心转向AI智能体
清一色糊了餐
发表于 10 小时前
1077
0
0
北京时间12月12日凌晨,谷歌赶在OpenAI宣布ChatGPT正式登陆iPhone之前,发布了全新模型Gemini 2.0。
谷歌CEO桑达尔·皮查伊称,这是谷歌迄今为止最强大的模型。凭借原生图像和原生音频的输出等多模态方面的提升,Gemini 2.0能够构建新的AI智能体,让谷歌离构建通用助手的愿景更进一步。
需要指出的是,Gemini 2.0主要开放给开发者以及受信任的测试人员。目前,Gemini 2.0 Flash体验版模型已经面向所有Gemini用户开放。
Gemini 2.0 Flash是建立在1.5 Flash基础之上的模型,此前1.5 Flash是谷歌最受开发者欢迎的版本。与1.5 Flash相比,Gemini 2.0 Flash在同样快速的响应时间下性能进一步增强。谷歌方面称,2.0 Flash在关键基准测试中甚至超越了1.5 Pro,其速度是1.5 Pro的两倍。
同时2.0 Flash还具有新功能,除了能够支持图片、视频和音频等多模态输入,还可以支持多模态输出,比如可直接生成图像与文本混合的内容,以及原生生成可控的多语言文本转语音(TTS)音频。它还可以原生调用Google Search、代码执行以及第三方用户定义的函数等工具。
全球Gemini用户现在可以在电脑端和移动端体验基于2.0 Flash优化后的聊天对话,并且该版本将很快在Gemini移动应用中推出。基于这个新模型,用户还可以体验到Gemini助手。明年初,谷歌还会将Gemini 2.0扩展到更多产品中。
Gemini 2.0最大的变化在于把重心转向AI智能体,想要做所有AI智能体的基座模型。基于此,Gemini 2.0开发出了一系列原型,这些原型能够帮助用户完成相应的任务。
其中,Project Astra的升级版,用于探索未来通用AI助手能力的研究原型。自从在Google I/O大会上推出Project Astra以来 ,谷歌一直向那些在Android手机上使用它的受信任的测试人员收集反馈。此次推出的升级版可以实现多种语言和混合语言之间的对话,也可使用 Google Search、Google Lens和Google Map等新工具,能够记住长达10分钟的会话内容,并可以近于人类对话的延迟来理解语言。
全新的Project Mariner从浏览器入手探索人与智能体交互的未来发展。Project Mariner 使用了Gemini 2.0构建的早期研究原型,能够理解和推理浏览器页面中的信息,包括像素和文本、代码、图像和表单等网页元素,然后通过实验性的Chrome扩展程序帮助用户完成相应任务。此次升级,Project Mariner改进了原来速度较慢的问题。
简而言之,用户可以用这项功能让浏览器自己去帮你完成特定任务,例如批量查找某些网站上邮箱地址,从而在一定程度上实现浏览器的“自动运行”。
Jules则是面向开发者的编码智能体,它可以直接集成到GitHub工作流程中来协助开发者完成开发任务。
在谷歌的演示视频中,演示人员输入了一长串含有详细编程问题的提示语,之后Jules会对这些要求进行分析,给出一个三步的编程解决方案,待点击同意后,模型就会开启自动编程,生成代码。这无疑有助于开发者进一步提升工作效率。
去年年底,谷歌发布了Gemini 1.0模型,主要能力是整合和理解信息。而Gemini 2.0能让信息变得更加有用。桑达尔·皮查伊表示,Gemini 2.0的进展得益于谷歌长达10年全栈式AI创新研究的投入,基于谷歌定制的硬件第六代TPU Trillium构建而成。
就在谷歌以最强大模型吸睛之时,OpenAI为期12天的产品发布活动仍在进行中。同一天,OpenAI对外展示了ChatGPT与苹果Apple Intelligence的整合,内容略显平淡。谷歌Gemini 2.0的突然发布,显然抢了不少OpenAI的风头。
在Gemini 2.0的加持下,谷歌一口气推出三款智能体产品,也意味着其在和微软绑定OpenAI、亚马逊与Anthropic的竞争中又迈出了重要一步。
智能体已经成为大模型领域竞争的核心方向。所谓智能体,是指能够感知环境、进行决策并采取行动以实现特定目标的系统,被视作大语言模型(LLM)落地应用的关键载体。
近两个月前,微软曾连发10个AI智能体,面向销售、运营等场景,随后又宣布Copilot Studio平台已支持用户构建自主智能体,同时发布5款预构建的智能体。而在刚刚结束的2024 re:Invent上,亚马逊一口气发布了6款大模型,其中Amazon Nova Premier同样是多模态大模型,专为复杂推理任务而生。
无论在消费端还是企业端场景中,AI智能体均有较多想象空间,商业化前景也较为明确。多位业内人士预计,2025年将是AI智能体商用爆发之年。届时,谷歌、OpenAI等科技巨头围绕智能体的竞争势必将愈发激烈。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- 奇富科技:助力提高数字金融安全水平和金融大模型落地应用
- 微软否认使用客户数据来训练人工智能模型
- OpenAI上线满血版o1大模型 以及每月200美元的ChatGPT Pro
- 奇富科技:助力数字金融安全水平提升 分享金融大模型前沿实践
- 英伟达携全新AI模型“颠覆”音频界:可创作音乐、修改人声
- 英偉達は新しいAIモデルを携えてオーディオ業界を「転覆」させた:音楽を創作し、人の声を修正することができる
- OpenAI又有王炸!正式推出AI视频生成模型Sora
- OpenAI正式推出AI视频生成模型Sora 会员无需额外付费
- 英伟达发布“NaVILA模型” 帮助机器人摆脱地图依赖
- 新东方“虽迟但到”,教育大模型时代来临了?
-
10月末に2800ドルのマイルストーンを突破した後、国際金価格は短い調整を経た。 11日のニューヨーク商品取引所で来年2月に引き渡されたCOMEX金先物は1.5%近く上昇し、2750ドルの関門を再び奪還し、最新のインフレデ ...
- 什么大师特
- 10 小时前
- 支持
- 反对
- 回复
- 收藏
-
米大統領選後の株式市場の上昇は年末まで続いており、ウォール街の大物たちが叫んだ来年の目標価格も年々上昇しているが、上昇を追う際にはすべての慎重さを捨ててはならないと警告するアナリストも少なくない。 一 ...
- SOHU
- 昨天 11:47
- 支持
- 反对
- 回复
- 收藏
-
12月10日夜、米株が取引を開始し、市場の注目はグーグルに集中し、終値までにグーグルA(GOOGL)は5.59%上昇し、185.17ドルだった。その時価総額は一夜にして1120億ドル(約8120億元)も大幅に増加した。 情報面で ...
- 内托体头
- 昨天 11:15
- 支持
- 反对
- 回复
- 收藏
-
①北京時間の今夜21時30分に発表された米国の11月CPIデータを、「2024年最後の重量級の米国経済指標」にたとえても、誇張ではないようだ。②FRBが来週12月の金利決定会合を開催するにあたり、今晩のCPIもFRBが金利 ...
- 不正经的工程师
- 昨天 10:29
- 支持
- 反对
- 回复
- 收藏