Bläddra i källkod

修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题

zhouyang.xie 2 månader sedan
förälder
incheckning
e115acac83
1 ändrade filer med 2 tillägg och 2 borttagningar
  1. 2 2
      src/train_model_grpo_v1.py

+ 2 - 2
src/train_model_grpo_v1.py

@@ -237,8 +237,8 @@ if __name__ == "__main__":
     # 根据操作系统选择后端
     backend = 'gloo' if os.name == 'nt' else 'nccl'
 
-    # 使用文件初始化方法
-    init_method = f'../tmp' # env://  # 文件路径需要所有进程都能访问
+    # 使用文件初始化方法  2025-3-11 成功验证支持windows
+    init_method = f'env://' # env://  # 文件路径需要所有进程都能访问
     dist.init_process_group(backend=backend, init_method=init_method)
 
     print(f"Initialized distributed training with backend: {backend}")