il y a 9 mois · e67953b407
--- a/src/train_model_grpo.py
+++ b/src/train_model_grpo.py
@@ -122,6 +122,14 @@ class ModelTrainer:
 
															             gpu_memory_utilization=0.6, # 0.6 # Reduce if out of memory
														
 
															         )
														
 
															+        # 将模型移动到设备上
														
 
															+        model = model.to_empty(device='cuda')  # 使用 to_empty 而不是 to
														
 
															+
														
 
															+        # 初始化模型的权重
														
 
															+        for param in model.parameters():
														
 
															+            if param.is_meta:
														
 
															+                param.data = torch.randn_like(param)  # 随机初始化
														
 
															+
														
 
															         # 添加 LoRA 适配器
														
 
															         model = FastLanguageModel.get_peft_model(
														
 
															             model,
														
@@ -144,9 +152,9 @@ class ModelTrainer:
 
															         # 加载训练集和测试集
														
 
															         train_dataset = load_dataset("json", data_files={"train": train_data_path}, split="train")
														
 
															-        # train_loader = torch.utils.data.DataLoader(
														
 
															-        #     train_dataset, batch_size=1, shuffle=True, pin_memory=True  # 启用 pin_memory  2025年3月7日未能验证通过
														
 
															-        # )
														
 
															+        train_loader = torch.utils.data.DataLoader(
														
 
															+            train_dataset, batch_size=1, shuffle=True, pin_memory=True  # 启用 pin_memory  2025年3月7日未能验证通过
														
 
															+        )
														
 
															         # train_data_path: 训练数据路径，格式为 JSONL
														
 
															         return train_dataset