Commit történet

Szerző SHA1 Üzenet Dátum
  zhouyang.xie 526921091e 修改train_model_grpo_v1.2.py 试图恢复模型训练自我思考 8 hónapja
  root 5e21073349 添加示例数据集- gsm8k 小学数学 9 hónapja
  zhouyang.xie 73a5634a5e 遵循面向对象思想重构train_model_grpo.py 9 hónapja
  zhouyang.xie 2275fcf164 遵循面向对象思想重构train_model_grpo.py 9 hónapja
  zhouyang.xie 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 9 hónapja
  zhouyang.xie b4c422b4be 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 9 hónapja
  zhouyang.xie ca5fe63b52 完善README.MD说明 9 hónapja
  zhouyang.xie b777163795 2025-3-5 18:29 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; 9 hónapja
  zhouyang.xie e2a3b8ab23 2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; 9 hónapja
  zhouyang.xie c5fc011955 完善代码及说明 9 hónapja
  zhouyang.xie 7270ddb56d Initialize commit 9 hónapja