Kaynağa Gözat

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie 2 ay önce
ebeveyn
işleme
0f1c8812cb
1 değiştirilmiş dosya ile 0 ekleme ve 0 silme
  1. 0 0
      data/processed/train.jsonl

Dosya farkı çok büyük olduğundan ihmal edildi
+ 0 - 0
data/processed/train.jsonl


Bu fark içinde çok fazla dosya değişikliği olduğu için bazı dosyalar gösterilmiyor