zhouyang.xie 2275fcf164 遵循面向对象思想重构train_model_grpo.py 9 月之前
..
__pycache__ 2275fcf164 遵循面向对象思想重构train_model_grpo.py 9 月之前
UnslothAlignPropTrainer.py 2275fcf164 遵循面向对象思想重构train_model_grpo.py 9 月之前
UnslothBCOTrainer.py c5fc011955 完善代码及说明 10 月之前
UnslothCPOTrainer.py 7270ddb56d Initialize commit 10 月之前
UnslothDDPOTrainer.py 2275fcf164 遵循面向对象思想重构train_model_grpo.py 9 月之前
UnslothDPOTrainer.py 7270ddb56d Initialize commit 10 月之前
UnslothGKDTrainer.py 7270ddb56d Initialize commit 10 月之前
UnslothGRPOTrainer.py e2a3b8ab23 2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; 10 月之前
UnslothKTOTrainer.py 7270ddb56d Initialize commit 10 月之前
UnslothNashMDTrainer.py 7270ddb56d Initialize commit 10 月之前
UnslothORPOTrainer.py 7270ddb56d Initialize commit 10 月之前
UnslothOnlineDPOTrainer.py e2a3b8ab23 2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; 10 月之前
UnslothPPOTrainer.py 7270ddb56d Initialize commit 10 月之前
UnslothPRMTrainer.py 7270ddb56d Initialize commit 10 月之前
UnslothRLOOTrainer.py 7270ddb56d Initialize commit 10 月之前
UnslothRewardTrainer.py 7270ddb56d Initialize commit 10 月之前
UnslothSFTTrainer.py 7270ddb56d Initialize commit 10 月之前
UnslothXPOTrainer.py 7270ddb56d Initialize commit 10 月之前