zhouyang.xie 2275fcf164 遵循面向对象思想重构train_model_grpo.py vor 9 Monaten
..
__pycache__ 2275fcf164 遵循面向对象思想重构train_model_grpo.py vor 9 Monaten
UnslothAlignPropTrainer.py 2275fcf164 遵循面向对象思想重构train_model_grpo.py vor 9 Monaten
UnslothBCOTrainer.py c5fc011955 完善代码及说明 vor 10 Monaten
UnslothCPOTrainer.py 7270ddb56d Initialize commit vor 10 Monaten
UnslothDDPOTrainer.py 2275fcf164 遵循面向对象思想重构train_model_grpo.py vor 9 Monaten
UnslothDPOTrainer.py 7270ddb56d Initialize commit vor 10 Monaten
UnslothGKDTrainer.py 7270ddb56d Initialize commit vor 10 Monaten
UnslothGRPOTrainer.py e2a3b8ab23 2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; vor 10 Monaten
UnslothKTOTrainer.py 7270ddb56d Initialize commit vor 10 Monaten
UnslothNashMDTrainer.py 7270ddb56d Initialize commit vor 10 Monaten
UnslothORPOTrainer.py 7270ddb56d Initialize commit vor 10 Monaten
UnslothOnlineDPOTrainer.py e2a3b8ab23 2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; vor 10 Monaten
UnslothPPOTrainer.py 7270ddb56d Initialize commit vor 10 Monaten
UnslothPRMTrainer.py 7270ddb56d Initialize commit vor 10 Monaten
UnslothRLOOTrainer.py 7270ddb56d Initialize commit vor 10 Monaten
UnslothRewardTrainer.py 7270ddb56d Initialize commit vor 10 Monaten
UnslothSFTTrainer.py 7270ddb56d Initialize commit vor 10 Monaten
UnslothXPOTrainer.py 7270ddb56d Initialize commit vor 10 Monaten