zhouyang.xie 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 9 ماه پیش
..
__pycache__ 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 9 ماه پیش
UnslothAlignPropTrainer.py ca5fe63b52 完善README.MD说明 9 ماه پیش
UnslothBCOTrainer.py c5fc011955 完善代码及说明 9 ماه پیش
UnslothCPOTrainer.py 7270ddb56d Initialize commit 9 ماه پیش
UnslothDDPOTrainer.py ca5fe63b52 完善README.MD说明 9 ماه پیش
UnslothDPOTrainer.py 7270ddb56d Initialize commit 9 ماه پیش
UnslothGKDTrainer.py 7270ddb56d Initialize commit 9 ماه پیش
UnslothGRPOTrainer.py e2a3b8ab23 2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; 9 ماه پیش
UnslothKTOTrainer.py 7270ddb56d Initialize commit 9 ماه پیش
UnslothNashMDTrainer.py 7270ddb56d Initialize commit 9 ماه پیش
UnslothORPOTrainer.py 7270ddb56d Initialize commit 9 ماه پیش
UnslothOnlineDPOTrainer.py e2a3b8ab23 2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; 9 ماه پیش
UnslothPPOTrainer.py 7270ddb56d Initialize commit 9 ماه پیش
UnslothPRMTrainer.py 7270ddb56d Initialize commit 9 ماه پیش
UnslothRLOOTrainer.py 7270ddb56d Initialize commit 9 ماه پیش
UnslothRewardTrainer.py 7270ddb56d Initialize commit 9 ماه پیش
UnslothSFTTrainer.py 7270ddb56d Initialize commit 9 ماه پیش
UnslothXPOTrainer.py 7270ddb56d Initialize commit 9 ماه پیش