zhouyang.xie/unsloth_deepseek

Автор	SHA1 Съобщение	Дата
zhouyang.xie	4e4eb90c07 修改train_model_grpo.py代码，验证GRPO训练模型，使用显卡共享内存 pin_memory=True 验证失败	преди 3 месеца
zhouyang.xie	e67953b407 修改train_model_grpo.py代码，验证GRPO训练模型，使用显卡共享内存 pin_memory=True 验证失败——内存	преди 3 месеца
zhouyang.xie	0e6c18290b 修改train_model_grpo.py代码，验证GRPO训练模型，使用显卡共享内存 pin_memory=True 验证失败——内存	преди 3 месеца
zhouyang.xie	bcd25a2773 修改train_model_grpo.py代码，验证GRPO训练模型	преди 3 месеца
zhouyang.xie	1d5a7faf12 修改train_model_grpo.py代码，尝试使用显卡的共享内存	преди 3 месеца
zhouyang.xie	0b6a61f70a git管理中去掉目录__pycache__	преди 3 месеца
zhouyang.xie	d3713ffe46 验证GRPO 训练的模型推理	преди 3 месеца
zhouyang.xie	e1158e5adf 完善README.MD文件，完善Unsloth 模型训练方案说明	преди 3 месеца
zhouyang.xie	196440966b 修改注释	преди 3 месеца
zhouyang.xie	57918b817c 修改注释	преди 3 месеца
zhouyang.xie	3425b3e67c 调整train_model_grpo.py 减少模型训练步骤，模型加载、训练中的推理禁用vllm	преди 3 месеца
zhouyang.xie	8720a4fbd5 调整train_model_grpo.py 减少训练步骤目的快速技术预研unsloth+vllm	преди 3 месеца
zhouyang.xie	ef858b9d68 调整train_model_grpo.py 启用vLLM 减少gpu_memory_utilization参数在模型加载或推理时的内存占用比例	преди 3 месеца
zhouyang.xie	20d99482e2 调整train_model_grpo.py 禁用vLLM	преди 3 месеца
zhouyang.xie	1cfcf6522b 调整train_model_grpo.py 提高vLLM 对VRAM的占用	преди 3 месеца
zhouyang.xie	a1f825a642 将临时输出移除git的管理	преди 3 месеца
zhouyang.xie	ca5fe63b52 完善README.MD说明	преди 3 месеца
zhouyang.xie	b777163795 2025-3-5 18:29 README.MD大模型选型评估，训练、微调所需计算资源评估；完善训练数据集生成、训练、推理源程序；	преди 3 месеца
zhouyang.xie	e2a3b8ab23 2025-3-5 README.MD大模型选型评估，训练、微调所需计算资源评估；完善训练数据集生成、训练、推理源程序；	преди 3 месеца
zhouyang.xie	c5fc011955 完善代码及说明	преди 3 месеца
zhouyang.xie	7270ddb56d Initialize commit	преди 3 месеца

По-нови По-стари

Commit History Намери

Commit History