-
Llama 3.2:Meta最新推出的开源模型,包括视觉大语言模型和设备端纯文本模型
Llama 3.1是Meta最新推出的开源大语言模型,包括90B和11B两种参数规格的视觉大语言模型,还有能在设备端本地运行的1B和3B轻量级纯文本模型,包括预训练和指令调整版。1B和3B模型支持128K tokens上下文,适配高通和联发科硬件,并针对Arm处理器做了优化。- 7.7k
- 0
-
CogVideoX-智谱推出的开源AI视频生成模型
CogVideoX是由智谱AI开发的视频生成大模型,具备强大的视频生成能力、只需输入文本或图片就可以轻松完成视频制作。此次开源的是CogVideoX-2B,20亿参数规格的模型,是CogVideoX 系列视频生成模型中的第一个模型,与智谱推出的AI视频生成产品清影同源。- 3.5k
- 0
-
Mistral Large 2:Mistral AI发布的新一代 AI 大模型
Mistral Large 2 是法国AI公司 Mistral AI 发布的新一代 AI 大语言模型, Mistral Large 2 有 1230 亿个参数和 128k 的上下文窗口,支持法语、德语、西班牙语、意大利语、中文等多语言能力,覆盖 80 多种编程语言。该模型展示了改进的推理和准确性,在 MMLU 基准测试中达到了 84%,并与 GPT-4o、Claude 3 Opus 和 Llama…- 2.4k
- 0
-
Llama 3.1:Meta最新推出的开源大语言模型
Llama 3.1是Meta最新推出的开源大语言模型,有三种规格:80亿、700亿和4050亿参数,支持八种语言,具备128K扩展上下文长度。它提供卓越的通用知识、数学计算、多语言翻译和工具使用能力,开放下载并允许开发者定制和微调。- 13.2k
- 0
-
Mistral NeMo:Mistral AI和英伟达联合发布的AI小模型
Mistral NeMo是由法国AI公司Mistral AI与NVIDIA合作开发的一个120亿(12B)参数的大型语言模型。它提供高达128k tokens的上下文窗口,并且在推理、世界知识和编码准确性方面达到了该规模模型的先进水平。- 2.2k
- 0
-
DCLM-7B:苹果最新推出的开源AI语言模型
DCLM-7B是苹果与合作伙伴一起推出的开源小型语言模型,全部开源,包括权重、训练代码和数据集。DCLM-7B性能优异,接近大型模型,采用decoder-only架构,上下文长度2048。DCLM在多个基准任务上性能出色,支持商业使用。- 16.3k
- 0