Просмотр исходного кода

修改train_model_grpo.py代码,验证GRPO训练模型,使用显卡共享内存 pin_memory=True 验证失败

zhouyang.xie 4 месяцев назад
Родитель
Сommit
4e4eb90c07
1 измененных файлов с 2 добавлено и 2 удалено
  1. 2 2
      src/train_model_grpo.py

+ 2 - 2
src/train_model_grpo.py

@@ -121,7 +121,7 @@ class ModelTrainer:
             max_lora_rank = lora_rank,
             gpu_memory_utilization=0.6, # 0.6 # Reduce if out of memory
         )
-        
+
         # 将模型移动到设备上
         model = model.to_empty(device='cuda')  # 使用 to_empty 而不是 to
 
@@ -226,7 +226,7 @@ if __name__ == "__main__":
     # model_name: 预训练模型的路径
     max_seq_length = 6000  # 单次会话(single session) 的最大 token 长度,一个token大约3-4 字节(Byte)
     dtype = torch.float16  # 数据类型
-    load_in_4bit = False  # 是否以4位精度加载模型
+    load_in_4bit = True  # 是否以4位精度加载模型
     lora_rank=16
 
     # 定义训练集和测试集路径