AI智慧秀 北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式 OpenAI 发布 o1 系列模型,旨在专门解决难题。OpenAI o1 在数学、 代码、长程规划等问题上取得了显著提升,而背后的成功最重要离不开后训练阶段 (Post-