Przeglądaj źródła

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie 2 miesięcy temu
rodzic
commit
12eacbadc0
2 zmienionych plików z 3 dodań i 3 usunięć
  1. 0 0
      data/processed/train.jsonl
  2. 3 3
      src/generate_data.py

Plik diff jest za duży
+ 0 - 0
data/processed/train.jsonl


+ 3 - 3
src/generate_data.py

@@ -32,11 +32,11 @@ class DataGenerator:
              # 当 human 和 bot 都取到后,拼装一个新的 JSON
             target_data = {
                 "question": case_data[1]+" 请予以故障诊断?",
-                "answer":   "".join([case_data[2],"\n",case_data[3],"\n",case_data[4]]),
+                "answer":   "".join([case_data[2],case_data[3],case_data[4]]),
                 "prompt": [
                     {
-                        # "content": f"\nRespond in the following format:\n<reasoning>\n {case_data[2]} \n</reasoning>\n<answer>\n {case_data[3]}  {case_data[4]} \n</answer>\n",
-                        "content": "\nRespond in the following format:\n<reasoning>\n...\n</reasoning>\n<answer>\n...\n</answer>\n",
+                        "content": f"\nRespond in the following format:\n<reasoning>\n {case_data[2]} \n</reasoning>\n<answer>\n {case_data[3]}  {case_data[4]} \n</answer>\n",
+                        # "content": "\nRespond in the following format:\n<reasoning>\n...\n</reasoning>\n<answer>\n...\n</answer>\n",
                         "role": "system"
                     },
                     {

Niektóre pliki nie zostały wyświetlone z powodu dużej ilości zmienionych plików