zhouyang.xie 2275fcf164 遵循面向对象思想重构train_model_grpo.py há 9 meses atrás
..
__pycache__ 2275fcf164 遵循面向对象思想重构train_model_grpo.py há 9 meses atrás
UnslothAlignPropTrainer.py 2275fcf164 遵循面向对象思想重构train_model_grpo.py há 9 meses atrás
UnslothBCOTrainer.py c5fc011955 完善代码及说明 há 10 meses atrás
UnslothCPOTrainer.py 7270ddb56d Initialize commit há 10 meses atrás
UnslothDDPOTrainer.py 2275fcf164 遵循面向对象思想重构train_model_grpo.py há 9 meses atrás
UnslothDPOTrainer.py 7270ddb56d Initialize commit há 10 meses atrás
UnslothGKDTrainer.py 7270ddb56d Initialize commit há 10 meses atrás
UnslothGRPOTrainer.py e2a3b8ab23 2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; há 10 meses atrás
UnslothKTOTrainer.py 7270ddb56d Initialize commit há 10 meses atrás
UnslothNashMDTrainer.py 7270ddb56d Initialize commit há 10 meses atrás
UnslothORPOTrainer.py 7270ddb56d Initialize commit há 10 meses atrás
UnslothOnlineDPOTrainer.py e2a3b8ab23 2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; há 10 meses atrás
UnslothPPOTrainer.py 7270ddb56d Initialize commit há 10 meses atrás
UnslothPRMTrainer.py 7270ddb56d Initialize commit há 10 meses atrás
UnslothRLOOTrainer.py 7270ddb56d Initialize commit há 10 meses atrás
UnslothRewardTrainer.py 7270ddb56d Initialize commit há 10 meses atrás
UnslothSFTTrainer.py 7270ddb56d Initialize commit há 10 meses atrás
UnslothXPOTrainer.py 7270ddb56d Initialize commit há 10 meses atrás