site stats
DeepSeek V3 预览版低调发布,但是非常牛逼。 一句话重点:编程能力超过 Claude Sonnet 3.5。 这还只是预览版。 测试的基准是 Aider 的多语言基准,一个用于衡量模型编程能力的基准,具体介绍放在图2,官网放到回复里了。 几个模型的得分 - 62% o1 - 48% DeepSeek V3 预览 - 45% Claude - 38%
sign_in_with_google sign_in_with_google

6286 位用户此时在线

24小时点击排行 Top 10:
  1. 本站自动实时分享网络热点
  2. 24小时实时更新
  3. 所有言论不代表本站态度
  4. 欢迎对信息踊跃评论评分
  5. 评分越高,信息越新,排列越靠前