Commit History

作者 SHA1 備註 提交日期
  zhouyang.xie e8e87e7975 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 3 月之前
  zhouyang.xie ce572ff677 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 3 月之前
  zhouyang.xie 40a04f3723 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 3 月之前
  zhouyang.xie 842e332caa 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 3 月之前
  zhouyang.xie 759d7db359 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 3 月之前
  zhouyang.xie 7982caa3ba 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 3 月之前
  zhouyang.xie 39bf52bf4e 更换unsloth grpo的训练数据集并验证 3 月之前
  zhouyang.xie 5b4e2ffb17 更换unsloth grpo的训练数据集并验证 3 月之前
  zhouyang.xie 97fe68c387 更换unsloth grpo的训练数据集并验证 3 月之前
  zhouyang.xie efef4ac205 更换unsloth grpo的训练数据集并验证 3 月之前
  zhouyang.xie 83590fcdc7 完善README.MD 增加vLLM说明 3 月之前
  zhouyang.xie 87845c5b5d 修改train_model_grpo.py代码,验证GRPO训练模型,设置训练轮数 参数 num_train_epochs 3 月之前
  zhouyang.xie 23704681d0 修改train_model_grpo.py代码,验证GRPO训练模型,输出训练用数据集为jsonl文件,保存至data/backup相对路径 3 月之前
  zhouyang.xie 4e4eb90c07 修改train_model_grpo.py代码,验证GRPO训练模型,使用显卡共享内存 pin_memory=True 验证失败 3 月之前
  zhouyang.xie e67953b407 修改train_model_grpo.py代码,验证GRPO训练模型,使用显卡共享内存 pin_memory=True 验证失败——内存 3 月之前
  zhouyang.xie 0e6c18290b 修改train_model_grpo.py代码,验证GRPO训练模型,使用显卡共享内存 pin_memory=True 验证失败——内存 3 月之前
  zhouyang.xie bcd25a2773 修改train_model_grpo.py代码,验证GRPO训练模型 3 月之前
  zhouyang.xie 1d5a7faf12 修改train_model_grpo.py代码,尝试使用显卡的共享内存 3 月之前
  zhouyang.xie 0b6a61f70a git管理中去掉 目录__pycache__ 3 月之前
  zhouyang.xie d3713ffe46 验证GRPO 训练的模型推理 3 月之前
  zhouyang.xie e1158e5adf 完善README.MD文件 ,完善Unsloth 模型训练方案说明 3 月之前
  zhouyang.xie 196440966b 修改注释 3 月之前
  zhouyang.xie 57918b817c 修改注释 3 月之前
  zhouyang.xie 3425b3e67c 调整train_model_grpo.py 减少模型训练步骤,模型加载、训练中的推理禁用vllm 3 月之前
  zhouyang.xie 8720a4fbd5 调整train_model_grpo.py 减少训练步骤 目的快速技术预研unsloth+vllm 3 月之前
  zhouyang.xie ef858b9d68 调整train_model_grpo.py 启用vLLM 减少gpu_memory_utilization参数在模型加载或推理时的内存占用比例 3 月之前
  zhouyang.xie 20d99482e2 调整train_model_grpo.py 禁用vLLM 3 月之前
  zhouyang.xie 1cfcf6522b 调整train_model_grpo.py 提高vLLM 对VRAM的占用 3 月之前
  zhouyang.xie a1f825a642 将临时输出移除git的管理 3 月之前
  zhouyang.xie ca5fe63b52 完善README.MD说明 3 月之前