Преглед изворни кода

修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题

zhouyang.xie пре 3 месеци
родитељ
комит
ffaaf20313
1 измењених фајлова са 6 додато и 6 уклоњено
  1. 6 6
      src/train_model_grpo.py

+ 6 - 6
src/train_model_grpo.py

@@ -126,13 +126,13 @@ class ModelTrainer:
             gpu_memory_utilization=0.6, # 0.6 # Reduce if out of memory
         )
 
-        # 将模型移动到设备上
-        model = model.to_empty(device='cuda')  # 使用 to_empty 而不是 to
+        # # 将模型移动到设备上
+        # model = model.to_empty(device='cuda')  # 使用 to_empty 而不是 to
 
-        # 初始化模型的权重
-        for param in model.parameters():
-            if param.is_meta:
-                param.data = torch.randn_like(param)  # 随机初始化
+        # # 初始化模型的权重
+        # for param in model.parameters():
+        #     if param.is_meta:
+        #         param.data = torch.randn_like(param)  # 随机初始化
 
         # 添加 LoRA 适配器
         model = FastLanguageModel.get_peft_model(