site stats
可验证意味着基本上就可以转化为封闭式问题 封闭式可验证问题的任何benchmark早晚都会被攻克,这个没啥疑问 但太多开放性问题无法用自动化/AI转换成封闭化/可验证问题,这不是暂时的,会是很长很长时间无法解决的瓶颈 而“判断”(我更倾向于evaluation这个词)这件事情本身,就是一个开放性问题
sign_in_with_google sign_in_with_google

3164 位用户此时在线

24小时点击排行 Top 10:
  1. 本站自动实时分享网络热点
  2. 24小时实时更新
  3. 所有言论不代表本站态度
  4. 欢迎对信息踊跃评论评分
  5. 评分越高,信息越新,排列越靠前