This website works better with JavaScript
Sākums
Izpētīt
Palīdzība
Reģistrēties
Pierakstīties
zhouyang.xie
/
unsloth_deepseek
Vērot
1
Pievienot zvaigznīti
0
Atdalīts
0
Faili
Problēmas
0
Izmaiņu pieprasījumi
0
Vikivietne
Koks:
acebf42a2f
Atzari
Tagi
master
Revīziju vēsture
Meklēt
Autors
SHA1
Ziņojums
Datums
zhouyang.xie
acebf42a2f
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
2 mēneši atpakaļ
zhouyang.xie
7409bac7d8
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
2 mēneši atpakaļ
zhouyang.xie
9ff6f0acd6
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
2 mēneši atpakaļ
zhouyang.xie
dc546bc9b7
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
2 mēneši atpakaļ