谷歌发布支持200万token大模型Gemini 1.5 Flash
123457931
发表于 2024-5-15 10:31:56
1156
0
0
据悉,全新Gemini 1.5 Pro具有原生音频理解、系统指令、JSON模式等,能够使用视频计算机视觉来分析图像(帧)和音频(语音)的视频,这使其具有人类水平的视觉感知。使用深度神经网络,Gemini 1.5可以以超人的精度识别图像(和视频帧)中的物体、场景和人物。同时,为了快速响应与成本效益,谷歌还推出更轻的模型Gemini 1.5 Flash。
同时,针对OpenAI发布的GPT-4o,谷歌也发布了对标的大模型Project Astra。此外,谷歌进一步升级开源模型Gemma 2。
过去一年,谷歌在生成式AI领域奋起直追。2023年12月,谷歌推出全球最强大、最通用的多模态通用大模型:Gemini,中文称“双子座”。在此次大会上,皮查伊透露,Gemini发布后短短3个月内就有100万+Gemini Advanced注册;20亿用户产品(user products)全部使用 Gemini;超过150万开发者使用Gemini。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。