This website works better with JavaScript
Startsida
Utforska
Hjälp
Registrera dig
Logga in
zhouyang.xie
/
unsloth_deepseek
Bevaka
1
Stjärnmärk
0
Fork
0
Filer
Ärenden
0
Pull-förfrågningar
0
Wiki
Bläddra i källkod
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
zhouyang.xie
2 månader sedan
förälder
7409bac7d8
incheckning
0f1c8812cb
1 ändrade filer
med
0 tillägg
och
0 borttagningar
Delad Vy
Visa Diff Statistik
0
0
data/processed/train.jsonl
Filskillnaden har hållts tillbaka eftersom den är för stor
+ 0
- 0
data/processed/train.jsonl
Vissa filer visades inte eftersom för många filer har ändrats