Quellcode durchsuchen

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie vor 2 Monaten
Ursprung
Commit
0f1c8812cb
1 geänderte Dateien mit 0 neuen und 0 gelöschten Zeilen
  1. 0 0
      data/processed/train.jsonl

Datei-Diff unterdrückt, da er zu groß ist
+ 0 - 0
data/processed/train.jsonl


Einige Dateien werden nicht angezeigt, da zu viele Dateien in diesem Diff geändert wurden.