但是这个应该不能去把责任归到用户身上,而必须是归到 Anthropic 身上。因为新的模型刚推出的时候,它内部没经过大量的测试,导致 Inference Infra 出现各种 bug,导致各种降智行为,甚至这一次 Opus 4.8 对 edit tool 调用的 old_string 参数都会传错。推出之后,当把用户当成小白鼠测试过一段时间之后,他们收集到这些真实的用户的血与泪换来的 feedback 后,偷偷把这个模型的 Inference Infra bug 修完,然后舆论回暖,导致大家嘲笑刚开始吐槽这个模型的人,这个很不公平的。
比如前天 opus 4.8 就偷偷修好了我上面提到的 edit tool 调用的时候 old_string 都传错的弱智问题,你看,从昨天开始使用 opus 4.8 的人,跟刚开始就使用 opus 4.8 的人对其评价就完全不一样。