阿里开源数学大模型Qwen2-Math,超GPT-4o,数学能力全球第一

近日,阿里巴巴开源了最新数学模型Qwen2-Math,一共有基础和指令微调两种版本,包括1.5B、7B和72B三种参数。

根据阿里在主流数学基准测试显示,Qwen2-Math-72B指令微调版本的性能超过了GPT-4o、Cloude-3.5-Sonnet、Gemini-1.5Pro等知名闭源模型,就连Meta最新开源的超强模型Llama-3.1-405B也照样拿下。也就是说,Qwen2-Math-72B是目前全球最强的数学推理大模型。

该模型通过在高质量的数学专用语料库上进行预训练,并结合奖励信号与二元信号进行微调优化,展现出卓越的数学解题能力。阿里还对模型进行了去污染处理,确保了测试的准确性。当前,Qwen2-Math仅支持英文版本,但阿里表示将很快推出中英双语版本,助力更多用户开发生成式AI应用。

阿里开源数学大模型Qwen2-Math,超GPT-4o,数学能力全球第一

 

点此查看原文

0 条回复 A文章作者 M管理员
    暂无评论内容
error: