瀏覽代碼

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie 2 月之前
父節點
當前提交
0f1c8812cb
共有 1 個文件被更改,包括 0 次插入0 次删除
  1. 0 0
      data/processed/train.jsonl

文件差異過大導致無法顯示
+ 0 - 0
data/processed/train.jsonl


部分文件因文件數量過多而無法顯示