Procházet zdrojové kódy

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie před 2 měsíci
rodič
revize
12eacbadc0
2 změnil soubory, kde provedl 3 přidání a 3 odebrání
  1. 0 0
      data/processed/train.jsonl
  2. 3 3
      src/generate_data.py

Rozdílová data souboru nebyla zobrazena, protože soubor je příliš velký
+ 0 - 0
data/processed/train.jsonl


+ 3 - 3
src/generate_data.py

@@ -32,11 +32,11 @@ class DataGenerator:
              # 当 human 和 bot 都取到后,拼装一个新的 JSON
             target_data = {
                 "question": case_data[1]+" 请予以故障诊断?",
-                "answer":   "".join([case_data[2],"\n",case_data[3],"\n",case_data[4]]),
+                "answer":   "".join([case_data[2],case_data[3],case_data[4]]),
                 "prompt": [
                     {
-                        # "content": f"\nRespond in the following format:\n<reasoning>\n {case_data[2]} \n</reasoning>\n<answer>\n {case_data[3]}  {case_data[4]} \n</answer>\n",
-                        "content": "\nRespond in the following format:\n<reasoning>\n...\n</reasoning>\n<answer>\n...\n</answer>\n",
+                        "content": f"\nRespond in the following format:\n<reasoning>\n {case_data[2]} \n</reasoning>\n<answer>\n {case_data[3]}  {case_data[4]} \n</answer>\n",
+                        # "content": "\nRespond in the following format:\n<reasoning>\n...\n</reasoning>\n<answer>\n...\n</answer>\n",
                         "role": "system"
                     },
                     {

Některé soubory nejsou zobrazeny, neboť je v těchto rozdílových datech změněno mnoho souborů