Commit History

Author SHA1 Message Date
  zhouyang.xie 0f1c8812cb 修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 3 months ago
  zhouyang.xie 12eacbadc0 修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 3 months ago
  root 94f8ee853c 更新 风电机组数据集格式(还原至gsm8k数据集格式) 3 months ago
  zhouyang.xie b17ab0381a 重新生成 风电机组故障诊断的数据集 3 months ago
  zhouyang.xie 18ec7c1cc4 重新生成 风电机组故障诊断的数据集 3 months ago
  zhouyang.xie 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 3 months ago
  zhouyang.xie 97fe68c387 更换unsloth grpo的训练数据集并验证 3 months ago
  zhouyang.xie e2a3b8ab23 2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; 3 months ago
  zhouyang.xie c5fc011955 完善代码及说明 3 months ago