Browse Source

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie 4 tháng trước cách đây
mục cha
commit
0f1c8812cb
1 tập tin đã thay đổi với 0 bổ sung0 xóa
  1. 0 0
      data/processed/train.jsonl

Những thai đổi đã bị hủy bỏ vì nó quá lớn
+ 0 - 0
data/processed/train.jsonl


Một số tệp đã không được hiển thị bởi vì quá nhiều tập tin thay đổi trong này khác