Commit History

Upphovsman SHA1 Meddelande Datum
  zhouyang.xie b4c422b4be 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 månader sedan
  zhouyang.xie a0c6a060cf 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 månader sedan
  zhouyang.xie a59d8b40a2 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 månader sedan