Commit History

Upphovsman SHA1 Meddelande Datum
  zhouyang.xie 3f8e53e024 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 2 månader sedan
  zhouyang.xie e2a3b8ab23 2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; 3 månader sedan
  zhouyang.xie c5fc011955 完善代码及说明 3 månader sedan