Grok-1：马斯克xAI发布的开源AI大模型，可商用

AI训练模型
24年3月18日
编辑

AIHubAI布道师

Grok-1是什么？

Grok-1是马斯克旗下AI公司xAI发布的开源AI大模型，其参数量达到了3140亿，远超OpenAI GPT-3.5的1750亿。这是迄今参数量最大的开源大语言模型，遵照Apache 2.0协议开放模型权重和架构。

Grok-1是一个混合专家（Mixture-of-Experts，MOE）大模型，这种MOE架构重点在于提高大模型的训练和推理效率，形象地理解，MOE就像把各个领域的“专家”集合到了一起，遇到任务派发给不同领域的专家，最后汇总结论，提升效率。决定每个专家做什么的是被称为“门控网络”的机制。

Grok-1模型的公开发布，为研究人员和开发者提供了一个新的大型语言模型资源。

Grok-1的主要特性

xAI还特别强调了Grok-1的几大特性：

首先，Grok-1是一个未针对特定任务进行微调的基础模型，它基于大量文本数据训练而成；
其次，作为一款基于混合专家技术构建的大语言模型，Grok-1拥有3140亿参数，在处理每个token时有25%的权重处于活跃状态；
最后，Grok-1是xAI团队使用JAX和Rust编程语言自定义训练栈从零开始训练的成果，训练完成于2023年10月。

Grok-1的技术参数

基础信息：

模型大小：3140亿参数，其中混合了8名专家（2名活跃）
活动参数：860亿
特色技术：使用旋转嵌入（Rotary Embeddings，简称#rope），而非固定位置嵌入

模型结构细节:

分词器词汇量：131,072（与GPT-4相似），即2^17
嵌入尺寸：6,144（48*128）
架构层数：64层变压器层
每层结构：包含一个解码器层，具有多头注意力块和密集块
键值大小：128

多头注意力块:

查询头数量：48
键/值（KV）头数量：8
KV大小：128
密集块（Dense Block）:

加宽系数：8
隐藏层大小：32,768
每个代币从8名专家中选择2名

旋转位置嵌入:
尺寸：6,144，与模型的输入嵌入大小相同
上下文长度：8,192个标记
精度：bf16

如何使用Grok-1？

xAI已经将Grok-1的权重和架构在GitHub上开源。

GitHub地址：https://github.com/xai-org/grok-1

{{userData.name}}已认证

Grok-1：马斯克xAI发布的开源AI大模型，可商用

Grok-1是什么？

Grok-1的主要特性

Grok-1的技术参数

如何使用Grok-1？

讯飞绘镜：讯飞推出的一站式AI短视频创作工具

豆包 - 字节跳动旗下免费AI助手

讯飞星火认知大模型

AIPPT：AI一键生成高质量PPT

Trae - 字节跳动推出的免费AI编程工具

白日梦AI-免费的AI视频创作平台，支持生成6分钟视频

豆包MarsCode-字节跳动推出的免费AI编程助手

笔灵AI论文写作 - 专业AI论文写作平台

AIPaperPass：AI一键生成高质量论文

蝉镜-AI数字人视频创作平台

通义灵码 - 阿里推出的AI智能编码助手

闪剪-AI数字人视频生成平台

墨狐AI：你的网文短篇小说写作助手

讯飞文书 - 科大讯飞发布的AI公文写作工具

茅茅虫论文写作 - 一站式AI论文写作平台

{{userData.name}}已认证

Grok-1是什么？

Grok-1的主要特性

Grok-1的技术参数

如何使用Grok-1？

语鲸大模型-深言科技推出的开源中英双语大语言模型

PowerLawGLM-法律垂直AI大模型

阅文妙笔大模型：国内首个网文大模型

用友YonGPT：首个企业服务大模型

讯飞绘镜：讯飞推出的一站式AI短视频创作工具

豆包 - 字节跳动旗下免费AI助手

讯飞星火认知大模型

AIPPT：AI一键生成高质量PPT

Trae - 字节跳动推出的免费AI编程工具

白日梦AI-免费的AI视频创作平台，支持生成6分钟视频

豆包MarsCode-字节跳动推出的免费AI编程助手

笔灵AI论文写作 - 专业AI论文写作平台

AIPaperPass：AI一键生成高质量论文

蝉镜-AI数字人视频创作平台

通义灵码 - 阿里推出的AI智能编码助手

闪剪-AI数字人视频生成平台

墨狐AI：你的网文短篇小说写作助手

讯飞文书 - 科大讯飞发布的AI公文写作工具

茅茅虫论文写作 - 一站式AI论文写作平台