Bläddra i källkod

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie 2 månader sedan
förälder
incheckning
0f1c8812cb
1 ändrade filer med 0 tillägg och 0 borttagningar
  1. 0 0
      data/processed/train.jsonl

Filskillnaden har hållts tillbaka eftersom den är för stor
+ 0 - 0
data/processed/train.jsonl


Vissa filer visades inte eftersom för många filer har ändrats