site stats
!!真正的全过程开源的中英文双语大模型。 1. 4.7T tokens 的中英文清洗后语料,配比挺合理。 2. 扫描PDF 转 Markdown 的工作流,可以识别图片、表格和公式!!! 3. 中英文的预训练数据处理 Pipeline,拿来即用~ 4. 最终的 7B…
sign_in_with_google sign_in_with_google

1410 位用户此时在线

24小时点击排行 Top 10:
  1. 本站自动实时分享网络热点
  2. 24小时实时更新
  3. 所有言论不代表本站态度
  4. 欢迎对信息踊跃评论评分
  5. 评分越高,信息越新,排列越靠前