Commit History

Autor SHA1 Mensaxe Data
  zhouyang.xie 13e76ccf11 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 hai 9 meses
  zhouyang.xie 5ea0c43503 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 hai 9 meses
  zhouyang.xie 8603d51a1c 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 hai 9 meses
  zhouyang.xie 526921091e 修改train_model_grpo_v1.2.py 试图恢复模型训练自我思考 hai 9 meses
  zhouyang.xie ef6f70cbf7 修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 hai 9 meses
  zhouyang.xie acebf42a2f 修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 hai 9 meses
  zhouyang.xie 0f1c8812cb 修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 hai 9 meses
  zhouyang.xie 7409bac7d8 修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 hai 9 meses
  zhouyang.xie f8443b3682 修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 hai 9 meses
  zhouyang.xie 12eacbadc0 修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 hai 9 meses
  zhouyang.xie 9ff6f0acd6 修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 hai 9 meses
  zhouyang.xie dc546bc9b7 修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 hai 9 meses
  zhouyang.xie 73be517bb5 修改 风电机组数据集格式 hai 9 meses
  zhouyang.xie 98ecc19bfb 修改 风电机组数据集格式 hai 9 meses
  root 94f8ee853c 更新 风电机组数据集格式(还原至gsm8k数据集格式) hai 9 meses
  root f8e2d2bfcd 更新 风电机组数据集格式(还原至gsm8k数据集格式) hai 9 meses
  zhouyang.xie 30a1a69274 修改 风电机组数据集格式 hai 9 meses
  zhouyang.xie 948ec7eb5d 修改 风电机组数据集格式 hai 9 meses
  zhouyang.xie 39ae535b0d 修改 风电机组数据集格式 hai 9 meses
  zhouyang.xie 5a1c263040 修改 grpo v1.1.py源代码- correctness_reward_func函数 hai 9 meses
  root 5e21073349 添加示例数据集- gsm8k 小学数学 hai 9 meses
  zhouyang.xie a13f9a7e87 重新生成 风电机组故障诊断的数据集 hai 10 meses
  zhouyang.xie 2a0bb731cc 重新生成 风电机组故障诊断的数据集 hai 10 meses
  zhouyang.xie b17ab0381a 重新生成 风电机组故障诊断的数据集 hai 10 meses
  zhouyang.xie 18ec7c1cc4 重新生成 风电机组故障诊断的数据集 hai 10 meses
  zhouyang.xie 1021527859 完善README.MD - 增加 奖励函数的说明 hai 10 meses
  zhouyang.xie b704be1c79 完善README.MD - 增加 奖励函数的说明 hai 10 meses
  zhouyang.xie cfe49ef53e 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 hai 10 meses
  zhouyang.xie 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 hai 10 meses
  zhouyang.xie dff6b0d9c7 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 hai 10 meses