Переглянути джерело

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie 2 місяців тому
батько
коміт
0f1c8812cb
1 змінених файлів з 0 додано та 0 видалено
  1. 0 0
      data/processed/train.jsonl

Різницю між файлами не показано, бо вона завелика
+ 0 - 0
data/processed/train.jsonl


Деякі файли не було показано, через те що забагато файлів було змінено