zhouyang.xie
|
0b6a61f70a
git管理中去掉 目录__pycache__
|
преди 3 месеца |
zhouyang.xie
|
d3713ffe46
验证GRPO 训练的模型推理
|
преди 3 месеца |
zhouyang.xie
|
e1158e5adf
完善README.MD文件 ,完善Unsloth 模型训练方案说明
|
преди 3 месеца |
zhouyang.xie
|
196440966b
修改注释
|
преди 3 месеца |
zhouyang.xie
|
57918b817c
修改注释
|
преди 3 месеца |
zhouyang.xie
|
3425b3e67c
调整train_model_grpo.py 减少模型训练步骤,模型加载、训练中的推理禁用vllm
|
преди 3 месеца |
zhouyang.xie
|
8720a4fbd5
调整train_model_grpo.py 减少训练步骤 目的快速技术预研unsloth+vllm
|
преди 3 месеца |
zhouyang.xie
|
ef858b9d68
调整train_model_grpo.py 启用vLLM 减少gpu_memory_utilization参数在模型加载或推理时的内存占用比例
|
преди 3 месеца |
zhouyang.xie
|
20d99482e2
调整train_model_grpo.py 禁用vLLM
|
преди 3 месеца |
zhouyang.xie
|
1cfcf6522b
调整train_model_grpo.py 提高vLLM 对VRAM的占用
|
преди 3 месеца |
zhouyang.xie
|
a1f825a642
将临时输出移除git的管理
|
преди 3 месеца |
zhouyang.xie
|
ca5fe63b52
完善README.MD说明
|
преди 3 месеца |
zhouyang.xie
|
b777163795
2025-3-5 18:29 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序;
|
преди 3 месеца |
zhouyang.xie
|
e2a3b8ab23
2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序;
|
преди 3 месеца |
zhouyang.xie
|
c5fc011955
完善代码及说明
|
преди 3 месеца |
zhouyang.xie
|
7270ddb56d
Initialize commit
|
преди 3 месеца |