Historique des commits

Auteur SHA1 Message Date
  zhouyang.xie 526921091e 修改train_model_grpo_v1.2.py 试图恢复模型训练自我思考 il y a 9 mois
  root 5e21073349 添加示例数据集- gsm8k 小学数学 il y a 9 mois
  zhouyang.xie 7270ddb56d Initialize commit il y a 9 mois