仅靠自身输出提升Coding能力。 当前,AI 大模型代码能力的提升受到多重因素制约,高质量人工数据稀缺、教师模型能力存在上限,强化学习(RL)方法也面临流程复杂和稳定性不足的问题。 日前,苹果团队近期提出了一种名为“简单自蒸馏”(Simple Self-Distillation ...