zhouyang.xie/unsloth_deepseek

Аутор	SHA1 Порука	Датум
zhouyang.xie	a8baf58623 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	пре 3 месеци
zhouyang.xie	a0c6a060cf 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	пре 3 месеци
zhouyang.xie	a59d8b40a2 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	пре 3 месеци
zhouyang.xie	e8e87e7975 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	пре 3 месеци
zhouyang.xie	ce572ff677 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	пре 3 месеци
zhouyang.xie	40a04f3723 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	пре 3 месеци
zhouyang.xie	842e332caa 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	пре 3 месеци
zhouyang.xie	759d7db359 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	пре 3 месеци
zhouyang.xie	7982caa3ba 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	пре 3 месеци
zhouyang.xie	39bf52bf4e 更换unsloth grpo的训练数据集并验证	пре 3 месеци
zhouyang.xie	5b4e2ffb17 更换unsloth grpo的训练数据集并验证	пре 3 месеци
zhouyang.xie	97fe68c387 更换unsloth grpo的训练数据集并验证	пре 3 месеци
zhouyang.xie	efef4ac205 更换unsloth grpo的训练数据集并验证	пре 3 месеци
zhouyang.xie	87845c5b5d 修改train_model_grpo.py代码，验证GRPO训练模型，设置训练轮数参数 num_train_epochs	пре 3 месеци
zhouyang.xie	23704681d0 修改train_model_grpo.py代码，验证GRPO训练模型，输出训练用数据集为jsonl文件，保存至data/backup相对路径	пре 3 месеци
zhouyang.xie	4e4eb90c07 修改train_model_grpo.py代码，验证GRPO训练模型，使用显卡共享内存 pin_memory=True 验证失败	пре 3 месеци
zhouyang.xie	e67953b407 修改train_model_grpo.py代码，验证GRPO训练模型，使用显卡共享内存 pin_memory=True 验证失败——内存	пре 3 месеци
zhouyang.xie	0e6c18290b 修改train_model_grpo.py代码，验证GRPO训练模型，使用显卡共享内存 pin_memory=True 验证失败——内存	пре 3 месеци
zhouyang.xie	bcd25a2773 修改train_model_grpo.py代码，验证GRPO训练模型	пре 3 месеци
zhouyang.xie	1d5a7faf12 修改train_model_grpo.py代码，尝试使用显卡的共享内存	пре 3 месеци
zhouyang.xie	d3713ffe46 验证GRPO 训练的模型推理	пре 3 месеци
zhouyang.xie	196440966b 修改注释	пре 3 месеци
zhouyang.xie	57918b817c 修改注释	пре 3 месеци
zhouyang.xie	3425b3e67c 调整train_model_grpo.py 减少模型训练步骤，模型加载、训练中的推理禁用vllm	пре 3 месеци
zhouyang.xie	8720a4fbd5 调整train_model_grpo.py 减少训练步骤目的快速技术预研unsloth+vllm	пре 3 месеци
zhouyang.xie	ef858b9d68 调整train_model_grpo.py 启用vLLM 减少gpu_memory_utilization参数在模型加载或推理时的内存占用比例	пре 3 месеци
zhouyang.xie	20d99482e2 调整train_model_grpo.py 禁用vLLM	пре 3 месеци
zhouyang.xie	1cfcf6522b 调整train_model_grpo.py 提高vLLM 对VRAM的占用	пре 3 месеци
zhouyang.xie	a1f825a642 将临时输出移除git的管理	пре 3 месеци
zhouyang.xie	ca5fe63b52 完善README.MD说明	пре 3 месеци

Новије Старије

Историја ревизија Пронађи

Историја ревизија