Histórico de Commits

Autor SHA1 Mensagem Data
  zhouyang.xie 716956f677 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie 2951868eb5 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie ebbaf5494a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie c8e0ee83b0 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie b4c422b4be 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie 541bec600c 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie 001d3b3965 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie 3e78f0431f 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie 75edbd5bb9 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie ffaaf20313 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie a8baf58623 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie a0c6a060cf 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie a59d8b40a2 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie e8e87e7975 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie ce572ff677 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie 40a04f3723 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie 842e332caa 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie 759d7db359 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie 7982caa3ba 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 9 meses atrás
  zhouyang.xie 39bf52bf4e 更换unsloth grpo的训练数据集并验证 há 10 meses atrás
  zhouyang.xie 5b4e2ffb17 更换unsloth grpo的训练数据集并验证 há 10 meses atrás
  zhouyang.xie 97fe68c387 更换unsloth grpo的训练数据集并验证 há 10 meses atrás
  zhouyang.xie efef4ac205 更换unsloth grpo的训练数据集并验证 há 10 meses atrás
  zhouyang.xie 83590fcdc7 完善README.MD 增加vLLM说明 há 10 meses atrás
  zhouyang.xie 87845c5b5d 修改train_model_grpo.py代码,验证GRPO训练模型,设置训练轮数 参数 num_train_epochs há 10 meses atrás
  zhouyang.xie 23704681d0 修改train_model_grpo.py代码,验证GRPO训练模型,输出训练用数据集为jsonl文件,保存至data/backup相对路径 há 10 meses atrás
  zhouyang.xie 4e4eb90c07 修改train_model_grpo.py代码,验证GRPO训练模型,使用显卡共享内存 pin_memory=True 验证失败 há 10 meses atrás
  zhouyang.xie e67953b407 修改train_model_grpo.py代码,验证GRPO训练模型,使用显卡共享内存 pin_memory=True 验证失败——内存 há 10 meses atrás
  zhouyang.xie 0e6c18290b 修改train_model_grpo.py代码,验证GRPO训练模型,使用显卡共享内存 pin_memory=True 验证失败——内存 há 10 meses atrás