Преглед изворни кода

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie пре 4 месеци
родитељ
комит
0f1c8812cb
1 измењених фајлова са 0 додато и 0 уклоњено
  1. 0 0
      data/processed/train.jsonl

Разлика између датотеке није приказан због своје велике величине
+ 0 - 0
data/processed/train.jsonl


Неке датотеке нису приказане због велике количине промена