zhouyang.xie/unsloth_deepseek

Автор	SHA1 Сообщение	Дата
zhouyang.xie	3e78f0431f 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	10 месяцев назад
zhouyang.xie	75edbd5bb9 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	10 месяцев назад
zhouyang.xie	ffaaf20313 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	10 месяцев назад
zhouyang.xie	a8baf58623 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	10 месяцев назад
zhouyang.xie	a0c6a060cf 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	10 месяцев назад
zhouyang.xie	a59d8b40a2 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	10 месяцев назад
zhouyang.xie	e8e87e7975 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	10 месяцев назад
zhouyang.xie	ce572ff677 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	10 месяцев назад
zhouyang.xie	40a04f3723 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	10 месяцев назад
zhouyang.xie	842e332caa 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	10 месяцев назад
zhouyang.xie	759d7db359 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	10 месяцев назад
zhouyang.xie	7982caa3ba 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	10 месяцев назад
zhouyang.xie	39bf52bf4e 更换unsloth grpo的训练数据集并验证	10 месяцев назад
zhouyang.xie	5b4e2ffb17 更换unsloth grpo的训练数据集并验证	10 месяцев назад
zhouyang.xie	97fe68c387 更换unsloth grpo的训练数据集并验证	10 месяцев назад
zhouyang.xie	efef4ac205 更换unsloth grpo的训练数据集并验证	10 месяцев назад
zhouyang.xie	83590fcdc7 完善README.MD 增加vLLM说明	10 месяцев назад
zhouyang.xie	87845c5b5d 修改train_model_grpo.py代码，验证GRPO训练模型，设置训练轮数参数 num_train_epochs	10 месяцев назад
zhouyang.xie	23704681d0 修改train_model_grpo.py代码，验证GRPO训练模型，输出训练用数据集为jsonl文件，保存至data/backup相对路径	10 месяцев назад
zhouyang.xie	4e4eb90c07 修改train_model_grpo.py代码，验证GRPO训练模型，使用显卡共享内存 pin_memory=True 验证失败	10 месяцев назад
zhouyang.xie	e67953b407 修改train_model_grpo.py代码，验证GRPO训练模型，使用显卡共享内存 pin_memory=True 验证失败——内存	10 месяцев назад
zhouyang.xie	0e6c18290b 修改train_model_grpo.py代码，验证GRPO训练模型，使用显卡共享内存 pin_memory=True 验证失败——内存	10 месяцев назад
zhouyang.xie	bcd25a2773 修改train_model_grpo.py代码，验证GRPO训练模型	10 месяцев назад
zhouyang.xie	1d5a7faf12 修改train_model_grpo.py代码，尝试使用显卡的共享内存	10 месяцев назад
zhouyang.xie	0b6a61f70a git管理中去掉目录__pycache__	10 месяцев назад
zhouyang.xie	d3713ffe46 验证GRPO 训练的模型推理	10 месяцев назад
zhouyang.xie	e1158e5adf 完善README.MD文件，完善Unsloth 模型训练方案说明	10 месяцев назад
zhouyang.xie	196440966b 修改注释	10 месяцев назад
zhouyang.xie	57918b817c 修改注释	10 месяцев назад
zhouyang.xie	3425b3e67c 调整train_model_grpo.py 减少模型训练步骤，模型加载、训练中的推理禁用vllm	10 месяцев назад

Новее Раньше

История коммитов Найти

История коммитов