太平洋科技 AI

谷歌开放Gemma：可商用，性能超过Llama 2

zhangxinxin 责任编辑：wangkeyue 发布于：2024-02-22 12:54

谷歌宣布了一个新的人工智能语言模型家族，名为Gemma，这是一种免费的开放权重模型，基于类似于更强大但封闭的Gemini模型的技术。与Gemini不同，Gemma模型可以在台式机或笔记本电脑上本地运行。这是自2022年OpenAI的ChatGPT掀起人工智能聊天机器人热潮以来，谷歌首次发布重要的开放大型语言模型(LLM)。

Gemma模型有两种尺寸:Gemma 2B(20亿个参数)和Gemma 7B(70亿个参数)，每种型号都有预训练和指令调整的版本。在人工智能中，参数是决定人工智能模型行为的神经网络中的值，权重是存储在文件中的这些参数的子集。

Gemma是由谷歌DeepMind和其他谷歌人工智能团队开发的，它借鉴了在Gemini开发期间学到的技术。Gemini是谷歌最有能力(面向公众)的商业LLM的家族名称，包括为其Gemini人工智能助手提供动力的那些LLM。谷歌表示，这个名字来自拉丁语gemma，意思是“宝石”。

虽然Gemma是谷歌自ChatGPT推出以来的第一个主要开放LLM(它过去曾发布过较小的研究模型，如FLAN-T5)，但它并不是谷歌对开放人工智能研究的第一个贡献。该公司引用了Transformer架构的开发，以及像TensorFlow、BERT、T5和JAX这样的版本作为关键贡献，并且说这些对该领域很重要是没有争议的。

由于较小的性能和较高的装配率，直到最近，较小的开放重量LLM更像是技术演示，因为一些较大的LLM已经开始达到GPT-3.5的性能水平。尽管如此，专家们认为，源代码可用和开放权重的人工智能模型是确保聊天机器人透明度和隐私的重要步骤。然而，Google Gemma并不是“开源”，因为这个术语通常指的是一种特定类型的软件许可证，几乎没有附加限制。

实际上，Gemma感觉像是与Meta相抗衡的一个引人注目的游戏，后者从去年2月开始发布开放权重模型(如LLaMA和LLaMA 2)。这种技术与OpenAI的GPT-4 Turbo等人工智能模型截然相反，后者只能通过ChatGPT应用程序和云API使用，不能在本地运行。路透社一篇关于Gemma的报道聚焦于Meta角度，并推测谷歌希望吸引更多的开发者使用其Vertex AI云平台。

我们还没有使用Gemma;然而，谷歌声称7B模型在数学、Python代码生成、一般知识和常识性推理任务的几个基准测试中都优于Meta的Llama 27b和13B模型。今天，它可以通过机器学习社区平台Kaggle和Hugging Face获得。

在其他新闻中，谷歌将Gemma的发布与“负责任的生成人工智能工具包”相结合，谷歌希望该工具包将为开发公司所谓的“安全和负责任的”人工智能应用程序提供指导和工具。

原文《Google goes“open AI”with Gemma,a free,open-weights chatbot family Gemma chatbots can run locally,and they reportedly outperform Meta's Llama 2》

Gemma 谷歌

zhangxinxin

原创栏目