site stats
LLaVA-Mini是一个高效的图像/视频理解大模型,仅需1个视觉token来表示每张图像:计算开销(FLOPs减少77%)、响应时延(低至40毫秒)以及显存占用(降至 0.6MB/图像,支持24GB GPU上进行长达 3 小时的视频处理)。 Paper: Code & Demo:
sign_in_with_google sign_in_with_google

2195 位用户此时在线

24小时点击排行 Top 10:
  1. 本站自动实时分享网络热点
  2. 24小时实时更新
  3. 所有言论不代表本站态度
  4. 欢迎对信息踊跃评论评分
  5. 评分越高,信息越新,排列越靠前