zhouyang.xie 2275fcf164 遵循面向对象思想重构train_model_grpo.py 3 ヶ月 前
..
__pycache__ 2275fcf164 遵循面向对象思想重构train_model_grpo.py 3 ヶ月 前
UnslothAlignPropTrainer.py 2275fcf164 遵循面向对象思想重构train_model_grpo.py 3 ヶ月 前
UnslothBCOTrainer.py c5fc011955 完善代码及说明 3 ヶ月 前
UnslothCPOTrainer.py 7270ddb56d Initialize commit 3 ヶ月 前
UnslothDDPOTrainer.py 2275fcf164 遵循面向对象思想重构train_model_grpo.py 3 ヶ月 前
UnslothDPOTrainer.py 7270ddb56d Initialize commit 3 ヶ月 前
UnslothGKDTrainer.py 7270ddb56d Initialize commit 3 ヶ月 前
UnslothGRPOTrainer.py e2a3b8ab23 2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; 3 ヶ月 前
UnslothKTOTrainer.py 7270ddb56d Initialize commit 3 ヶ月 前
UnslothNashMDTrainer.py 7270ddb56d Initialize commit 3 ヶ月 前
UnslothORPOTrainer.py 7270ddb56d Initialize commit 3 ヶ月 前
UnslothOnlineDPOTrainer.py e2a3b8ab23 2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; 3 ヶ月 前
UnslothPPOTrainer.py 7270ddb56d Initialize commit 3 ヶ月 前
UnslothPRMTrainer.py 7270ddb56d Initialize commit 3 ヶ月 前
UnslothRLOOTrainer.py 7270ddb56d Initialize commit 3 ヶ月 前
UnslothRewardTrainer.py 7270ddb56d Initialize commit 3 ヶ月 前
UnslothSFTTrainer.py 7270ddb56d Initialize commit 3 ヶ月 前
UnslothXPOTrainer.py 7270ddb56d Initialize commit 3 ヶ月 前