Przeglądaj źródła

修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题

zhouyang.xie 4 miesięcy temu
rodzic
commit
5a35a32199
1 zmienionych plików z 1 dodań i 1 usunięć
  1. 1 1
      src/train_model_grpo_v1.py

+ 1 - 1
src/train_model_grpo_v1.py

@@ -238,7 +238,7 @@ if __name__ == "__main__":
     backend = 'gloo' if os.name == 'nt' else 'nccl'
 
     # 使用文件初始化方法
-    init_method = 'file:///tmp/shared_file'  # 文件路径需要所有进程都能访问
+    init_method = f'../tmp' # env://  # 文件路径需要所有进程都能访问
     dist.init_process_group(backend=backend, init_method=init_method)
 
     print(f"Initialized distributed training with backend: {backend}")