Step R-mini是什么?
Step R-mini是由阶跃星辰推出的自研推理AI大模型,这是 Step 系列家族的首个推理模型,擅长逻辑推理、代码和数学问题的解决,同时也能进行文学创作等任务。Step R-mini 采用“慢思考”和反复验证的逻辑机制,能够提供准确、可靠的回答。
Step R-mini的主要特点
文理兼修:Step R-mini不仅在数学和逻辑推理上表现出色,在文学创作和日常对话中也能展示创造力,弥补了大多数推理模型在文科能力上的不足。大规模强化学习:通过大规模强化学习训练,Step R-mini使用On-Policy强化学习算法,实现了文理兼顾,并确保了在多个领域中的高效表现。推理能力:在数学题、代码、逻辑推理等场景中,Step R-mini能够进行深度思考和自我验证,提供多种解决方案并优化结果。视觉推理:除了语言推理,Step R-mini还在视觉推理领域取得阶段性进展,预计将在未来推出集成视觉推理的版本。
Step R-mini的模型评测
在 AIME 和 Math 等数学基准测试上,Step Reasoner mini 的成绩超过了 o1-preview,比肩 OpenAI o1-mini。在 LiveCodeBench 代码任务上,也比o1-preview 效果更佳。
Step R-mini的应用场景
数学和逻辑推理:能够解决复杂的奥数问题,通过多轮推理和自我验证得出多个解法。代码问题:在LeetCode等平台上,能够解答高难度的算法问题并生成可执行代码。内容创作:能够进行文学创作,提供富有创意和个性化的文本。翻译任务:遵循“信达雅”原则,提供精准且富有表达力的翻译。
如何体验Step R-mini?
Step R-mini 已经上线,登录跃问网页端 https://yuewen.cn,在左上角中选择“Step R-mini”,即可体验。