zhouyang.xie 97fe68c387 更换unsloth grpo的训练数据集并验证 3 月之前
..
train.jsonl 97fe68c387 更换unsloth grpo的训练数据集并验证 3 月之前
train_windturbine_old.jsonl 97fe68c387 更换unsloth grpo的训练数据集并验证 3 月之前
unified_chip2.jsonl 7270ddb56d Initialize commit 3 月之前