Step R-mini是什么?
Step R-mini是由阶跃星辰推出的自研推理AI大模型,这是 Step 系列家族的首个推理模型,擅长逻辑推理、代码和数学问题的解决,同时也能进行文学创作等任务。Step R-mini 采用“慢思考”和反复验证的逻辑机制,能够提供准确、可靠的回答。

Step R-mini的主要特点
- 文理兼修:Step R-mini不仅在数学和逻辑推理上表现出色,在文学创作和日常对话中也能展示创造力,弥补了大多数推理模型在文科能力上的不足。
- 大规模强化学习:通过大规模强化学习训练,Step R-mini使用On-Policy强化学习算法,实现了文理兼顾,并确保了在多个领域中的高效表现。
- 推理能力:在数学题、代码、逻辑推理等场景中,Step R-mini能够进行深度思考和自我验证,提供多种解决方案并优化结果。
- 视觉推理:除了语言推理,Step R-mini还在视觉推理领域取得阶段性进展,预计将在未来推出集成视觉推理的版本。
Step R-mini的模型评测
在 AIME 和 Math 等数学基准测试上,Step Reasoner mini 的成绩超过了 o1-preview,比肩 OpenAI o1-mini。在 LiveCodeBench 代码任务上,也比o1-preview 效果更佳。

Step R-mini的应用场景
- 数学和逻辑推理:能够解决复杂的奥数问题,通过多轮推理和自我验证得出多个解法。
- 代码问题:在LeetCode等平台上,能够解答高难度的算法问题并生成可执行代码。
- 内容创作:能够进行文学创作,提供富有创意和个性化的文本。
- 翻译任务:遵循“信达雅”原则,提供精准且富有表达力的翻译。
如何体验Step R-mini?
Step R-mini 已经上线,登录跃问网页端 https://yuewen.cn,在左上角中选择“Step R-mini”,即可体验。
©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。
