소스 검색

修改注释

zhouyang.xie 3 달 전
부모
커밋
196440966b
1개의 변경된 파일1개의 추가작업 그리고 1개의 파일을 삭제
  1. 1 1
      src/train_model_grpo.py

+ 1 - 1
src/train_model_grpo.py

@@ -119,7 +119,7 @@ class ModelTrainer:
             dtype=self.dtype,
             dtype=self.dtype,
             fast_inference = False, # Enable vLLM fast inference
             fast_inference = False, # Enable vLLM fast inference
             max_lora_rank = lora_rank,
             max_lora_rank = lora_rank,
-            gpu_memory_utilization=0.1,# Reduce if out of memory
+            gpu_memory_utilization=0.1, # 0.6 # Reduce if out of memory
         )
         )
         
         
         # 添加 LoRA 适配器
         # 添加 LoRA 适配器