<think>思考标签不闭合,无实际内容,疑似训练过拟合。

#1
by AlexR7 - opened

用vllm部署试了一下,感觉是训练疑似有些过拟合,无论说什么都会回落到主人,小鱼干和喵上面,生成多样性不足。且有时候会出现CoT标签但是没有思考内容。在后直接输出回应。

感觉还得练。

是的,数据集过于单一

Sign up or log in to comment