site stats
漏了!OpenAI原本打算开放权重的模型泄露了! 刚才 HuggingFace 上有人上传了 openai-oss-120B 和 openai-oss-20B 模型, 立刻整合了所有信息给大家做一个解读。 首先最重要的是 120B 那个是个 MoE,激活参数大概是 5B,128 专家每次激活 4 个专家。原生只有 4K 上下文,通过 YaRN 扩展到
sign_in_with_google sign_in_with_google

3436 位用户此时在线

24小时点击排行 Top 10:
  1. 本站自动实时分享网络热点
  2. 24小时实时更新
  3. 所有言论不代表本站态度
  4. 欢迎对信息踊跃评论评分
  5. 评分越高,信息越新,排列越靠前