ソースを参照

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie 2 ヶ月 前
コミット
0f1c8812cb
1 ファイル変更0 行追加0 行削除
  1. 0 0
      data/processed/train.jsonl

ファイルの差分が大きいため隠しています
+ 0 - 0
data/processed/train.jsonl


この差分においてかなりの量のファイルが変更されているため、一部のファイルを表示していません