zhouyang.xie 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
..
UnslothAlignPropTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
UnslothBCOTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
UnslothCPOTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
UnslothDDPOTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
UnslothDPOTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
UnslothGKDTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
UnslothGRPOTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
UnslothKTOTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
UnslothNashMDTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
UnslothORPOTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
UnslothOnlineDPOTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
UnslothPPOTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
UnslothPRMTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
UnslothRLOOTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
UnslothRewardTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
UnslothSFTTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前
UnslothXPOTrainer.cpython-311.pyc 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 4 月之前