碾压所有对手?谷歌发布轻量化开源大模型,笔记本电脑就可跑
我心如烟卸
发表于 2024-2-22 13:15:57
198
0
0
当地时间2月21日,谷歌宣布正式推出全新的开源大语言模型(LLM)“Gemma”, 旨在帮助开发人员和研究人员负责任地构建人工智能。
据介绍,Gemma大模型与谷歌规模最大、能力最强的人工智能模型Gemini共享技术和基础架构,“受到 Gemini的启发,Google DeepMind和Google其他团队合作开发了Gemma,并用拉丁语中意为‘宝石’的gemma为其命名。”
不过相比Gemini,Gemma更加轻量化。同时,Gemma依旧保持免费使用,其模型权重也一并开源,并且允许商用。
谷歌共发布了两种不同权重规模的模型,分别为Gemma 2B(20亿参数)和Gemma 7B(70亿参数)。每种规模都有预训练和指令微调版本,允许所有组织(无论规模大小)负责任地进行商用和分发。
谷歌发布Gemma的同日,风头正盛的芯片制造商英伟达也宣布,已与谷歌达成合作,确保Gemma模型在其芯片上顺利运行。英伟达还表示,旗下聊天机器人软件Chat With RTX也将马上支持Gemma。
值得注意的是,谷歌还强调,Gemma能在关键基准上越级碾压更大的模型。更为令人印象深刻的是,谷歌Gemma可以在笔记本电脑上运行。
谷歌方面表示,Gemini是我们当今广泛使用的最大、功能最强大的AI模型。与其他开放模型相比,Gemma 2B和7B能够在其范围内实现同类最佳的性能。Gemma模型能够直接在开发人员笔记本电脑或台式计算机上运行,“值得注意的是,Gemma在关键基准上超越了更大的模型,同时遵守我们安全和负责任的输出的严格标准。”
在开源模型的同时,谷歌还公布了有关Gemma的性能、数据集组成和建模方法的详细信息的技术报告。有研究人员在技术报告中发现,Gemma支持的词汇表大小达到了256K,这意味着它对英语之外的其他语言能够提供更好、更快的支持。
Gemma与Meta公司发布的Llama 2的参数对比,来自谷歌官网
Gemma也第一时间在知名开源模型库HuggingFace和HuggingChat上线。上线不久之后,在HuggingFace的“大语言模型榜单”上,Gemma 2B和7B模型已经双双登顶。
AI行业专家、深度学习框架Keras的作者Franois Chollet更是对此表示,最强开源大模型的位置现在易主了。
Gemma的竞争对手Llama 3也发布在即。1月19日,Meta联合创始人兼首席执行官扎克伯格宣布,Meta正在训练Llama 3并且将以负责任地方式继续开源。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
-
生成式人工知能(AI)が巻き起こす技術の波の中で、電力会社は意外にも資本市場の寵児になった。 今年のスタンダード500割株の上昇幅ランキングでは、Vistraなどの従来の電力会社が注目を集め、株価が2倍になってリ ...
- xifangczy
- 前天 12:14
- 支持
- 反对
- 回复
- 收藏
-
隔夜株式市場 世界の主要指数は金曜日に多くが下落し、最新のインフレデータが減速の兆しを示したおかげで、米株3大指数は大幅に回復し、いずれも1%超上昇した。 金曜日に発表されたデータによると、米国の11月のPC ...
- SNT
- 昨天 12:48
- 支持
- 反对
- 回复
- 收藏
-
長年にわたって、昔の消金大手の捷信消金の再編がようやく地に着いた。 天津銀行の発表によると、同行は京東傘下の2社、対外貿易信託などと捷信消金再編に参加する。再編が完了すると、京東の持ち株比率は65%に達し ...
- SNT
- 昨天 12:09
- 支持
- 反对
- 回复
- 收藏
-
グーグルは現地時間12月19日、新しい「推理」モデルとしてGemini 2.0 Flash Thinkingを発売すると発表した。紹介によると、このモデルはまだ実験段階であり、訓練を経た後、モデルが反応を起こした時に経験した「思 ...
- 地下水
- 前天 09:59
- 支持
- 反对
- 回复
- 收藏