OpenAI 推理模型核心研究员 Max Schwarzer 宣布离职,下一站是 Anthropic。
Schwarzer 在 OpenAI 的履历相当硬核——他是 o1 推理模型的早期参与者之一,o1-preview 最初就跑在他的一次实验性训练上。后来他主导了 o1 和 o3 的后训练(post-training,即模型训练完成后的对齐和调优阶段),并在过去一年里领导了整个后训练团队,先后交付了 GPT-5、5.1、5.2 和 5.3-Codex。
简单说,这是 OpenAI 推理路线上的关键人物。
他在告别帖中提到,离开的原因是想回归一线研究,不再做管理。他说自己对 Anthropic 的研究品味和价值观印象深刻,身边许多信任的同事近年也陆续加入了 Anthropic,他将在那里专注强化学习(RL)研究。
值得注意的是,Schwarzer 特意感谢了 OpenAI CEO Sam Altman、CTO Mark Chen、CEO Fidji Simo 等高层,措辞相当体面,没有任何不愉快的暗示。但一位带队交付了 GPT-5 系列后训练的核心人才选择出走,本身就说明了一些问题。
最近一两年,OpenAI 向 Anthropic 的人才流动已经不是个案,而是一个趋势。