Commit History

Upphovsman SHA1 Meddelande Datum
  zhouyang.xie f9dc2bb16f 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 2 månader sedan
  zhouyang.xie 8603d51a1c 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 2 månader sedan
  zhouyang.xie 98ecc19bfb 修改 风电机组数据集格式 3 månader sedan
  zhouyang.xie cfe49ef53e 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 3 månader sedan
  zhouyang.xie dff6b0d9c7 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 3 månader sedan
  zhouyang.xie 73a5634a5e 遵循面向对象思想重构train_model_grpo.py 3 månader sedan
  zhouyang.xie 6401c68303 遵循面向对象思想重构train_model_grpo.py 3 månader sedan
  zhouyang.xie 77168b22a2 遵循面向对象思想重构train_model_grpo.py 3 månader sedan
  zhouyang.xie 2275fcf164 遵循面向对象思想重构train_model_grpo.py 3 månader sedan
  zhouyang.xie d6429d6a79 遵循面向对象思想重构train_model_grpo.py 3 månader sedan