4 meses atrás · d32c4de968
--- a/src/qwen_notebook_clone.py
+++ b/src/qwen_notebook_clone.py
@@ -19,7 +19,7 @@ model, tokenizer = FastLanguageModel.from_pretrained(
 
				     model_name=model_name,
			
 
				     max_seq_length=512, # 2028
			
 
				     load_in_4bit=True,
			
 
				-    fast_inference=True,
			
 
				+    fast_inference=False,
			
 
				     max_lora_rank=128,
			
 
				     gpu_memory_utilization=0.5,
			
 
				 )
			
@@ -133,7 +133,7 @@ from vllm import SamplingParams
 
				 
			
 
				 # IMPORTANT: Extended training configuration for better results
			
 
				 training_args = GRPOConfig(
			
 
				-    use_vllm = True, 
			
 
				+    use_vllm = False, 
			
 
				     learning_rate = 5e-6,
			
 
				     adam_beta1 = 0.9,
			
 
				     adam_beta2 = 0.99,