首页 美股新闻 正文
  开源领域大模型,迎来了重磅新玩家。

  当地时间周三(2月21日),科技巨头谷歌发布了新一代开源模型“Gemma”,公司称其是轻量级中“最先进的”开放模型系列,超越了原本最强的Mistral 7B。
  谷歌官网写道,Gemma在拉丁语中意为“宝石”,以此命名的开放模型系列Gemma由Google DeepMind等团队开发,采用了与创建Gemini模型相同的研究和技术。
  目前,Gemma系列有两种权重规模的模型,分别为“Gemma 2B”和“Gemma 7B”,即20亿参数和70亿参数,以满足开发人员的不同需求。
  在性能方面,官方页面显示,Gemma 7B在MMLU(大规模多任务语言理解)的得分率达到64.3%。在同等规模中,原本最强Mistral 7B的得分率为62.5%,Meta的Llama-2 7B和13B也都与其有一定的差距。
  Gemma也第一时间上线了 HuggingFace 和 HuggingChat,每个人都能试一下它的生成能力:
  在Hugging Face的LLM leaderboard集中式排行榜上,Gemma的2B和7B模型的平均得分也位于各自参数规模的榜单前列。
  谷歌在新闻稿中写道,Gemma 2B和7B与其他开放模型相比,展现出在同等参数规模中最先进的性能,甚至超过了一些更大的模型,这得益于与公司最强的AI模型Gemini共享技术和基础架构。
  软件工程师Jeff dean称,尽管体量较小,但Gemma模型已经在关键基准测试中明显超越了更大的模型,对比的包括Llama-2 7B和13B,以及风头正劲的Mistral 7B。
  而且Gemma能够直接在开发人员的笔记本电脑或台式电脑上运行。除了轻量级模型之外,谷歌还推出了鼓励协作的工具以及负责任地使用这些模型的指南。
  Keras作者Franois Chollet对此直接表示:最强开源大模型的位置现在易主了。
  谷歌和Alphabet公司CEO 桑达尔·皮查伊(Sundar Pichai)表示,Gemma展示了强大的性能,从今天开始,该模型将在全球范围内提供,并可在笔记本电脑、工作站或谷歌云上运行。
  Google DeepMind CEO Demis Hassabis表示,轻量开源的Gemma是同类尺寸中性能最佳的模型。
  如今,谷歌不仅将对手瞄向OpenAI,而且打算占据一切,新模型将比扎克伯格的Llama-2“遥遥领先”。
  谷歌计划未来推出更多的Gemma变体,以适应更广泛的应用场景。目前,想要开始使用这些模型的开发者可以通过数据科学平台Kaggle、谷歌的Colab笔记本或通过谷歌云进行访问。
  每日经济新闻综合谷歌官网、公开资料
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

今早我梦醒了坎 注册会员
  • 粉丝

    0

  • 关注

    0

  • 主题

    34