李飞飞团队开源了一个新模型,

根据团队论文称,该模型仅花了 50 美元训练,

就达到了 和 OpenAI o1 和 DeepSeek r1 相似的水平。

但需要注意的是,它并不是从头训练的,而是使用 Qwen 模型进行微调。

S1模型:https://github.com/simplescaling/s1

添加新评论