zhouyang.xie
|
54948f9ffa
换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型
|
4 bulan lalu |
zhouyang.xie
|
32b376dc0b
换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型
|
4 bulan lalu |
zhouyang.xie
|
5d0fbd491c
换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型
|
4 bulan lalu |
zhouyang.xie
|
98d070b8c5
换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型
|
4 bulan lalu |
zhouyang.xie
|
f9dc2bb16f
换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型
|
4 bulan lalu |
zhouyang.xie
|
8603d51a1c
换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型
|
4 bulan lalu |
zhouyang.xie
|
98ecc19bfb
修改 风电机组数据集格式
|
4 bulan lalu |
zhouyang.xie
|
cfe49ef53e
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
4 bulan lalu |
zhouyang.xie
|
dff6b0d9c7
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
4 bulan lalu |
zhouyang.xie
|
73a5634a5e
遵循面向对象思想重构train_model_grpo.py
|
4 bulan lalu |
zhouyang.xie
|
6401c68303
遵循面向对象思想重构train_model_grpo.py
|
4 bulan lalu |
zhouyang.xie
|
77168b22a2
遵循面向对象思想重构train_model_grpo.py
|
4 bulan lalu |
zhouyang.xie
|
2275fcf164
遵循面向对象思想重构train_model_grpo.py
|
4 bulan lalu |
zhouyang.xie
|
d6429d6a79
遵循面向对象思想重构train_model_grpo.py
|
4 bulan lalu |