Просмотр исходного кода

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie 2 месяцев назад
Родитель
Сommit
0f1c8812cb
1 измененных файлов с 0 добавлено и 0 удалено
  1. 0 0
      data/processed/train.jsonl

Разница между файлами не показана из-за своего большого размера
+ 0 - 0
data/processed/train.jsonl


Некоторые файлы не были показаны из-за большого количества измененных файлов