Explorar o código

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie hai 2 meses
pai
achega
0f1c8812cb
Modificáronse 1 ficheiros con 0 adicións e 0 borrados
  1. 0 0
      data/processed/train.jsonl

A diferenza do arquivo foi suprimida porque é demasiado grande
+ 0 - 0
data/processed/train.jsonl


Algúns arquivos non se mostraron porque demasiados arquivos cambiaron neste cambio