标签: OpenAI o4强化学习训练