阿里云确认：李飞飞团队s1模型基于Qwen2.5-32B-Instruc

时间：2025-02-08 01:50 来源：科技快报网编辑：牧晓阅读量：8843

内容摘要:

，阿里云今日证实，李飞飞团队开发的人工智能推理模型s1是基于阿里通义千问模型进行训练的。该s1模型在数学和编码能力测试中表现出与OpenAIo1和DeepS...

，阿里云今日证实，李飞飞团队开发的人工智能推理模型s1是基于阿里通义千问模型进行训练的。

该s1模型在数学和编码能力测试中表现出与OpenAI o1和DeepSeek R1等尖端推理模型相似的效果。

据回应称，在16块H100 GPU上监督微调26分钟后，s1-32B取得了与o1和R1相当甚至更高27%竞赛数学问题表现的成果。

这一技术旨在通过训练一个人工智能模型来提取其“推理”能力，并采用了监督微调方法，比起DeepSeek使用大规模强化学习方法更具成本效益。s1利用了阿里巴巴旗下中国人工智能实验室Qwen提供的免费小型人工智能模型以及谷歌Gemini 2.0 Flash Thinking Experimental给出的答案背后思考过程。

郑重声明：此文内容为本网站转载企业宣传资讯，目的在于传播更多信息，与本站立场无关。仅供读者参考，并请自行核实相关内容。

下一篇:返回列表

上一篇:年年登高人人进步——达州银行开展元九登高征信宣传活动