Histórico de commits

Autor SHA1 Mensagem Data
  zhouyang.xie d3713ffe46 验证GRPO 训练的模型推理 10 meses atrás
  zhouyang.xie e1158e5adf 完善README.MD文件 ,完善Unsloth 模型训练方案说明 10 meses atrás
  zhouyang.xie 196440966b 修改注释 10 meses atrás
  zhouyang.xie 57918b817c 修改注释 10 meses atrás
  zhouyang.xie 3425b3e67c 调整train_model_grpo.py 减少模型训练步骤,模型加载、训练中的推理禁用vllm 10 meses atrás
  zhouyang.xie 8720a4fbd5 调整train_model_grpo.py 减少训练步骤 目的快速技术预研unsloth+vllm 10 meses atrás
  zhouyang.xie ef858b9d68 调整train_model_grpo.py 启用vLLM 减少gpu_memory_utilization参数在模型加载或推理时的内存占用比例 10 meses atrás
  zhouyang.xie 20d99482e2 调整train_model_grpo.py 禁用vLLM 10 meses atrás
  zhouyang.xie 1cfcf6522b 调整train_model_grpo.py 提高vLLM 对VRAM的占用 10 meses atrás
  zhouyang.xie a1f825a642 将临时输出移除git的管理 10 meses atrás
  zhouyang.xie ca5fe63b52 完善README.MD说明 10 meses atrás
  zhouyang.xie b777163795 2025-3-5 18:29 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; 10 meses atrás
  zhouyang.xie e2a3b8ab23 2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; 10 meses atrás
  zhouyang.xie c5fc011955 完善代码及说明 10 meses atrás
  zhouyang.xie 7270ddb56d Initialize commit 10 meses atrás