Pārlūkot izejas kodu

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie 2 mēneši atpakaļ
vecāks
revīzija
0f1c8812cb
1 mainītis faili ar 0 papildinājumiem un 0 dzēšanām
  1. 0 0
      data/processed/train.jsonl

Failā izmaiņas netiks attēlotas, jo tās ir par lielu
+ 0 - 0
data/processed/train.jsonl


Daži faili netika attēloti, jo izmaiņu fails ir pārāk liels