소스 검색

修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题

zhouyang.xie 3 달 전
부모
커밋
75edbd5bb9
1개의 변경된 파일2개의 추가작업 그리고 2개의 파일을 삭제
  1. 2 2
      src/train_model_grpo.py

+ 2 - 2
src/train_model_grpo.py

@@ -171,8 +171,8 @@ class ModelTrainer:
         #     train_dataset, batch_size=1, shuffle=True, pin_memory=True  
         # )
         
-        # 释放未使用的显存
-        torch.cuda.empty_cache()
+        # # 释放未使用的显存
+        # torch.cuda.empty_cache()
 
         training_args = GRPOConfig(
             use_vllm = False, # use vLLM for fast inference!