This website works better with JavaScript
Home
Verkennen
Help
Registreren
Inloggen
zhouyang.xie
/
unsloth_deepseek
Volgen
1
Ster
0
Vork
0
Bestanden
Issues
0
Pull-aanvragen
0
Wiki
Boom:
526921091e
Aftakkingen
Labels
master
Commit History
zoek
Auteur
SHA1
Bericht
Datum
zhouyang.xie
526921091e
修改train_model_grpo_v1.2.py 试图恢复模型训练自我思考
9 maanden geleden
root
5e21073349
添加示例数据集- gsm8k 小学数学
9 maanden geleden
zhouyang.xie
7270ddb56d
Initialize commit
9 maanden geleden