This website works better with JavaScript
Etusivu
Tutki
Apua
Rekisteröidy
Kirjaudu sisään
zhouyang.xie
/
unsloth_deepseek
Tarkkaile
1
Äänestä
0
Fork
0
Tiedostot
Ongelmat
0
Pull-pyynnöt
0
Wiki
Selaa lähdekoodia
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
zhouyang.xie
4 kuukautta sitten
vanhempi
7409bac7d8
commit
0f1c8812cb
1 muutettua tiedostoa
jossa
0 lisäystä
ja
0 poistoa
Jaettu näkymä
Näytä diff tilastot
0
0
data/processed/train.jsonl
Tiedoston diff-näkymää rajattu, sillä se on liian suuri
+ 0
- 0
data/processed/train.jsonl
Kaikkia tiedostoja ei voida näyttää, sillä liian monta tiedostoa muuttui tässä diffissä