zhouyang.xie/unsloth_deepseek

Author	SHA1 Message	Date
zhouyang.xie	1a610f237b 遵循面向对象思想重构train_model_grpo.py	9 months ago
zhouyang.xie	7196266feb 遵循面向对象思想重构train_model_grpo.py	9 months ago
zhouyang.xie	6b7ea96c64 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	4586925aa3 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	716956f677 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	2951868eb5 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	ebbaf5494a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	c8e0ee83b0 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	b4c422b4be 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	541bec600c 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	001d3b3965 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	3e78f0431f 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	75edbd5bb9 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	ffaaf20313 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	a8baf58623 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	a0c6a060cf 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	a59d8b40a2 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	e8e87e7975 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	ce572ff677 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	40a04f3723 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	842e332caa 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	759d7db359 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	7982caa3ba 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	9 months ago
zhouyang.xie	39bf52bf4e 更换unsloth grpo的训练数据集并验证	10 months ago
zhouyang.xie	5b4e2ffb17 更换unsloth grpo的训练数据集并验证	10 months ago
zhouyang.xie	97fe68c387 更换unsloth grpo的训练数据集并验证	10 months ago
zhouyang.xie	efef4ac205 更换unsloth grpo的训练数据集并验证	10 months ago
zhouyang.xie	83590fcdc7 完善README.MD 增加vLLM说明	10 months ago
zhouyang.xie	87845c5b5d 修改train_model_grpo.py代码，验证GRPO训练模型，设置训练轮数参数 num_train_epochs	10 months ago

Newer Older

Commit History Find

Commit History