9 mesi fa · cfe49ef53e
--- a/conf/conf_train.yaml
+++ b/conf/conf_train.yaml
@@ -23,8 +23,8 @@ num_generations: 8  # 8 表示每次训练时生成的候选输出数量
 
				 max_prompt_length: 256  # 256 模型输入的最大长度
			
 
				 max_completion_length: 384  # 200 模型输入（生成）的最大长度
			
 
				 num_train_epochs: 1  # 训练轮数
			
 
				-max_steps: 64  # 250 训练的最大步数
			
 
				-save_steps: 60  # 250 保存模型的步数（多少步保存一次模型）
			
 
				+max_steps: 12  # 250 训练的最大步数
			
 
				+save_steps: 12  # 250 保存模型的步数（多少步保存一次模型）
			
 
				 max_grad_norm: 0.1  # 梯度裁剪的最大阈值，防止梯度爆炸
			
 
				 report_to: "none"  # 报告工具，报告内容如 Weights & Biases，设置为none 表不将训练结果报告到外部工具
			
 
				 output_dir: "../models/outputs"  # 输出目录