Commit Verlauf

Autor SHA1 Nachricht Datum
  zhouyang.xie b4c422b4be 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 vor 4 Monaten
  zhouyang.xie a0c6a060cf 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 vor 4 Monaten
  zhouyang.xie a59d8b40a2 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 vor 4 Monaten