我们做了一个很有意思的东西。你可以用它来调整R1输出的速度,从而让自己的思考和r1的<think>同步,可以随时暂停修正你觉得R1思考错误的地方,把一些你的思想”植入”R1的思考过程中,最后得到最好的结果。似乎是R1特殊的训练方式,在其他reasoning模型上都很难做到这个。大家可以来玩玩。
nitter.poast.org/ii_posts/status/1884988031397924932#m
倪爽设计顾问,倪爽设计工作室