site stats
Anthropic 让 9 个 Claude 自己做对齐研究,结果比人类研究员强了四倍。这项研究聚焦一个核心问题:当 AI 比人类聪明之后,人类还能监督它吗?在对齐研究里,这叫“可扩展监督”(scalable oversight),一直停留在理论层面。Anthropic 决定让 Claude 自己上手试试。
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: