Lịch sử commit

Tác giả SHA1 Thông báo Ngày
  zhouyang.xie e8e87e7975 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 9 tháng trước cách đây
  zhouyang.xie ce572ff677 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 9 tháng trước cách đây
  zhouyang.xie 40a04f3723 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 9 tháng trước cách đây
  zhouyang.xie 842e332caa 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 9 tháng trước cách đây
  zhouyang.xie 759d7db359 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 9 tháng trước cách đây
  zhouyang.xie 7982caa3ba 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 9 tháng trước cách đây
  zhouyang.xie 39bf52bf4e 更换unsloth grpo的训练数据集并验证 9 tháng trước cách đây
  zhouyang.xie 5b4e2ffb17 更换unsloth grpo的训练数据集并验证 9 tháng trước cách đây
  zhouyang.xie 97fe68c387 更换unsloth grpo的训练数据集并验证 9 tháng trước cách đây
  zhouyang.xie efef4ac205 更换unsloth grpo的训练数据集并验证 9 tháng trước cách đây
  zhouyang.xie 87845c5b5d 修改train_model_grpo.py代码,验证GRPO训练模型,设置训练轮数 参数 num_train_epochs 10 tháng trước cách đây
  zhouyang.xie 23704681d0 修改train_model_grpo.py代码,验证GRPO训练模型,输出训练用数据集为jsonl文件,保存至data/backup相对路径 10 tháng trước cách đây
  zhouyang.xie 4e4eb90c07 修改train_model_grpo.py代码,验证GRPO训练模型,使用显卡共享内存 pin_memory=True 验证失败 10 tháng trước cách đây
  zhouyang.xie e67953b407 修改train_model_grpo.py代码,验证GRPO训练模型,使用显卡共享内存 pin_memory=True 验证失败——内存 10 tháng trước cách đây
  zhouyang.xie 0e6c18290b 修改train_model_grpo.py代码,验证GRPO训练模型,使用显卡共享内存 pin_memory=True 验证失败——内存 10 tháng trước cách đây
  zhouyang.xie bcd25a2773 修改train_model_grpo.py代码,验证GRPO训练模型 10 tháng trước cách đây
  zhouyang.xie 1d5a7faf12 修改train_model_grpo.py代码,尝试使用显卡的共享内存 10 tháng trước cách đây
  zhouyang.xie d3713ffe46 验证GRPO 训练的模型推理 10 tháng trước cách đây
  zhouyang.xie 196440966b 修改注释 10 tháng trước cách đây
  zhouyang.xie 57918b817c 修改注释 10 tháng trước cách đây
  zhouyang.xie 3425b3e67c 调整train_model_grpo.py 减少模型训练步骤,模型加载、训练中的推理禁用vllm 10 tháng trước cách đây
  zhouyang.xie 8720a4fbd5 调整train_model_grpo.py 减少训练步骤 目的快速技术预研unsloth+vllm 10 tháng trước cách đây
  zhouyang.xie ef858b9d68 调整train_model_grpo.py 启用vLLM 减少gpu_memory_utilization参数在模型加载或推理时的内存占用比例 10 tháng trước cách đây
  zhouyang.xie 20d99482e2 调整train_model_grpo.py 禁用vLLM 10 tháng trước cách đây
  zhouyang.xie 1cfcf6522b 调整train_model_grpo.py 提高vLLM 对VRAM的占用 10 tháng trước cách đây
  zhouyang.xie a1f825a642 将临时输出移除git的管理 10 tháng trước cách đây
  zhouyang.xie ca5fe63b52 完善README.MD说明 10 tháng trước cách đây
  zhouyang.xie b777163795 2025-3-5 18:29 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; 10 tháng trước cách đây