Selaa lähdekoodia

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie 4 kuukautta sitten
vanhempi
commit
0f1c8812cb
1 muutettua tiedostoa jossa 0 lisäystä ja 0 poistoa
  1. 0 0
      data/processed/train.jsonl

Tiedoston diff-näkymää rajattu, sillä se on liian suuri
+ 0 - 0
data/processed/train.jsonl


Kaikkia tiedostoja ei voida näyttää, sillä liian monta tiedostoa muuttui tässä diffissä