Commit History

Автор SHA1 Съобщение Дата
  zhouyang.xie f9dc2bb16f 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 преди 9 месеца
  zhouyang.xie 2275fcf164 遵循面向对象思想重构train_model_grpo.py преди 9 месеца
  zhouyang.xie ad874737a9 遵循面向对象思想重构train_model_grpo.py преди 9 месеца
  zhouyang.xie 2a20ead66c 遵循面向对象思想重构train_model_grpo.py преди 9 месеца
  zhouyang.xie 1a610f237b 遵循面向对象思想重构train_model_grpo.py преди 9 месеца
  zhouyang.xie 7196266feb 遵循面向对象思想重构train_model_grpo.py преди 9 месеца