il y a 8 mois · c413d5f5b4
--- a/src/qwen_notebook_clone.py
+++ b/src/qwen_notebook_clone.py
@@ -17,11 +17,11 @@ PatchFastRL("GRPO", FastLanguageModel)
 
				 model_name = f"../models/pretrained/DeepSeek-R1-Distill-Qwen-1.5B"
			
 
				 model, tokenizer = FastLanguageModel.from_pretrained(
			
 
				     model_name=model_name,
			
 
				-    max_seq_length=1024, # 2028
			
 
				+    max_seq_length=512, # 2028
			
 
				     load_in_4bit=True,
			
 
				     fast_inference=True,
			
 
				     max_lora_rank=128,
			
 
				-    gpu_memory_utilization=0.60,
			
 
				+    gpu_memory_utilization=0.5,
			
 
				 )
			
 
				 
			
 
				 model = FastLanguageModel.get_peft_model(