.. |
unsloth_compiled_cache
|
526921091e
修改train_model_grpo_v1.2.py 试图恢复模型训练自我思考
|
hace 2 meses |
__init__.py
|
7270ddb56d
Initialize commit
|
hace 3 meses |
check_pytorch_cuda.py
|
7270ddb56d
Initialize commit
|
hace 3 meses |
conf_train.py
|
f9dc2bb16f
换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型
|
hace 2 meses |
dataset_download.py
|
4995352642
换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型
|
hace 2 meses |
fine_tune_model.py
|
91bb641d42
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
hace 2 meses |
generate_data.py
|
f8443b3682
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
|
hace 2 meses |
inference.py
|
7b5779cba9
换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型
|
hace 2 meses |
main.obj
|
7270ddb56d
Initialize commit
|
hace 3 meses |
model_downloader.py
|
5064049d71
增加 RAG 技术验证
|
hace 2 semanas |
model_rag.md
|
5064049d71
增加 RAG 技术验证
|
hace 2 semanas |
model_rag.py
|
5064049d71
增加 RAG 技术验证
|
hace 2 semanas |
quantize_model.py
|
c5fc011955
完善代码及说明
|
hace 3 meses |
train_model_github_jwjohns.py
|
3f8e53e024
换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型
|
hace 2 meses |
train_model_grpo_original.py
|
77168b22a2
遵循面向对象思想重构train_model_grpo.py
|
hace 3 meses |
train_model_grpo_v0.py
|
91bb641d42
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
hace 2 meses |
train_model_grpo_v1.1.py
|
73be517bb5
修改 风电机组数据集格式
|
hace 2 meses |
train_model_grpo_v1.2.py
|
98d070b8c5
换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型
|
hace 2 meses |
train_model_grpo_v1.py
|
8f30a3f1e1
遵循面向对象思想重构train_model_grpo.py
|
hace 3 meses |
train_model_sft.py
|
91bb641d42
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
hace 2 meses |