算法

AdaptThink: 让模型决定是否思考

AdaptThink: Reasonin…

3 天 ago

AdaCoT:通过强化学习实现的帕累托最优自适应链式思维触发器

摘要 LRM在需要复杂推理的任务上常常面…

3 天 ago

Hmm等Token影响模型推理能力

Demystifying Reasoni…

3 天 ago

算法笔记——Transformer

Transformer大致结构如下: 左…

3 月 ago