История коммитов

Автор SHA1 Сообщение Дата
  zhouyang.xie f9dc2bb16f 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 9 месяцев назад
  zhouyang.xie 2275fcf164 遵循面向对象思想重构train_model_grpo.py 9 месяцев назад
  zhouyang.xie ad874737a9 遵循面向对象思想重构train_model_grpo.py 9 месяцев назад
  zhouyang.xie 2a20ead66c 遵循面向对象思想重构train_model_grpo.py 9 месяцев назад
  zhouyang.xie 1a610f237b 遵循面向对象思想重构train_model_grpo.py 9 месяцев назад
  zhouyang.xie 7196266feb 遵循面向对象思想重构train_model_grpo.py 9 месяцев назад