This website works better with JavaScript
首页
发现
帮助
注册
登录
zhouyang.xie
/
unsloth_deepseek
关注
1
点赞
0
派生
0
文件
工单管理
0
合并请求
0
Wiki
目录树:
acebf42a2f
分支列表
标签列表
master
提交历史
查找
作者
SHA1
备注
提交日期
zhouyang.xie
acebf42a2f
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
2 月之前
zhouyang.xie
7409bac7d8
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
2 月之前
zhouyang.xie
9ff6f0acd6
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
2 月之前
zhouyang.xie
dc546bc9b7
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
2 月之前