zhouyang.xie
|
f9dc2bb16f
换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型
|
2 månader sedan |
zhouyang.xie
|
8603d51a1c
换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型
|
2 månader sedan |
zhouyang.xie
|
98ecc19bfb
修改 风电机组数据集格式
|
3 månader sedan |
zhouyang.xie
|
cfe49ef53e
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
3 månader sedan |
zhouyang.xie
|
dff6b0d9c7
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
3 månader sedan |
zhouyang.xie
|
73a5634a5e
遵循面向对象思想重构train_model_grpo.py
|
3 månader sedan |
zhouyang.xie
|
6401c68303
遵循面向对象思想重构train_model_grpo.py
|
3 månader sedan |
zhouyang.xie
|
77168b22a2
遵循面向对象思想重构train_model_grpo.py
|
3 månader sedan |
zhouyang.xie
|
2275fcf164
遵循面向对象思想重构train_model_grpo.py
|
3 månader sedan |
zhouyang.xie
|
d6429d6a79
遵循面向对象思想重构train_model_grpo.py
|
3 månader sedan |