История коммитов

Автор SHA1 Сообщение Дата
  zhouyang.xie 5a1c263040 修改 grpo v1.1.py源代码- correctness_reward_func函数 10 месяцев назад
  root 5e21073349 添加示例数据集- gsm8k 小学数学 10 месяцев назад
  zhouyang.xie a13f9a7e87 重新生成 风电机组故障诊断的数据集 10 месяцев назад
  zhouyang.xie 2a0bb731cc 重新生成 风电机组故障诊断的数据集 10 месяцев назад
  zhouyang.xie b17ab0381a 重新生成 风电机组故障诊断的数据集 10 месяцев назад
  zhouyang.xie 18ec7c1cc4 重新生成 风电机组故障诊断的数据集 10 месяцев назад
  zhouyang.xie 1021527859 完善README.MD - 增加 奖励函数的说明 10 месяцев назад
  zhouyang.xie b704be1c79 完善README.MD - 增加 奖励函数的说明 10 месяцев назад
  zhouyang.xie cfe49ef53e 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 10 месяцев назад
  zhouyang.xie 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 10 месяцев назад
  zhouyang.xie dff6b0d9c7 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 10 месяцев назад
  zhouyang.xie 1bef66edba 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 10 месяцев назад
  zhouyang.xie 73a5634a5e 遵循面向对象思想重构train_model_grpo.py 10 месяцев назад
  zhouyang.xie 6401c68303 遵循面向对象思想重构train_model_grpo.py 10 месяцев назад
  zhouyang.xie a96f63805a 遵循面向对象思想重构train_model_grpo.py 10 месяцев назад
  zhouyang.xie 77168b22a2 遵循面向对象思想重构train_model_grpo.py 10 месяцев назад
  zhouyang.xie c7b5cc14c5 遵循面向对象思想重构train_model_grpo.py 10 месяцев назад
  zhouyang.xie 6529570532 遵循面向对象思想重构train_model_grpo.py 10 месяцев назад
  zhouyang.xie 71cb307569 遵循面向对象思想重构train_model_grpo.py 10 месяцев назад
  zhouyang.xie a656b45e84 遵循面向对象思想重构train_model_grpo.py 10 месяцев назад
  zhouyang.xie 4bb9924e00 遵循面向对象思想重构train_model_grpo.py 10 месяцев назад
  zhouyang.xie d97b2ed3a6 遵循面向对象思想重构train_model_grpo.py 10 месяцев назад
  zhouyang.xie cd5cc43486 遵循面向对象思想重构train_model_grpo.py 10 месяцев назад
  zhouyang.xie 95988ed459 遵循面向对象思想重构train_model_grpo.py 10 месяцев назад
  zhouyang.xie 8f30a3f1e1 遵循面向对象思想重构train_model_grpo.py 10 месяцев назад
  zhouyang.xie 3634ab78f0 遵循面向对象思想重构train_model_grpo.py 10 месяцев назад
  zhouyang.xie 93c55c7c93 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 10 месяцев назад
  zhouyang.xie e115acac83 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 10 месяцев назад
  zhouyang.xie 5a35a32199 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 10 месяцев назад
  zhouyang.xie 994ac49f1f 遵循面向对象思想重构train_model_grpo.py 10 месяцев назад