进入2024年，平板/手机终端LLM能力和半年前比，进步还是很明显的半年前在iPhone/Galaxy上用GPU跑7B模型大概能到6 token/s，现在已经能接近20 token/s了主要提升来自于两方面：一个是启用NPU优化提升到10 token/s，另外一个是新技术speculative decoding再提升一倍（原理如图）…

分享一个链接

发表一篇文章

任何有趣的，图片，热点新闻，视频，文字...

6092 位用户此时在线

24小时点击排行 Top 10：

成功不可复制，史上最奇葩的起号方式😂 没有一个字的台词，一家人靠抢食就把流量赚到手了，佩服👍😂

孟子义AI换脸高叶，结果本人都震惊了，果然美女都是相似的

物业起诉你不交物业费？3招让他低头

The Syrian Sunni Jihadists of Al-Julani's army are capturing young Kurdish women to use as sex slaves. All this is happening while Al-Julani is hosting American and European leaders in Damascus

Watch video

推荐这个视频，特别值得看、或者必须看，看了你就知道为什么人口不可逆，房地产不可逆。

#大冲塔运动上面不是都说了就业形势大好吗，评论区在阴阳啥🤔😁？ 😎 匿名投稿

Watch video

嘿，谢谢您的关注❤️

“增长幻象下的民生之困” 1月19日，在一则转发国家统计局的数据“2025年国内GDP增长百分之五”视频下，评论区却充斥着宏观数据下，民生社会焦虑与现实质疑。

这个老baby你肯定眼生，但那句“老许，你要老婆不”，你肯定想起来了，40年前无数人心目中的女神🌹 当年的老许宁愿拒绝亿万富豪的父亲，也不去美国继承遗产而那个带走了四川女人全部温柔的丛珊，却选择远赴法国～～ 😆👇

在南京花190万开的宁波海鲜小馆，一个月能赚多少钱？

小红书网友发帖，个人旅行信息被携程泄露给电诈集团，真是太可怕了。

一个人的愚蠢是怎么练成的！愚蠢并不是智商的缺陷，而是一种你练了二十年的生存本能。很多人一辈子都在用尽全力，让自己变得更笨，却以为这是在成熟。

1月19日，浙江宁波海曙区人民法院，许洛熙医疗事故责任纠纷案开庭现场。前来声援的群众冲到法院门前，向着小洛熙妈妈大喊：蓉蓉加油，蓉蓉必胜，而小洛熙妈妈也鞠躬回应。前来声援的群众不断聚集，爱心人士在现场为声援群众摆放了免费的饮用水。

1月19日，宁波海曙区人民法院门口，许洛熙医疗事故责任纠纷案。现场除了声援小洛熙的热心网友外外，还出现了大量手拿红旗的人，据知情人透露，这些人基本都是当地街道办，社区居委会，网格员，并且被公安安排在法院显眼位置进行素材宣传，同时周边安排便衣负责监控，防止这些人被现场气氛煽动失控。

父母的“七次放手”，成就孩子的一生！

人口警钟，中国人口下降进入了一个不可逆的趋势。（北大历史学博士肖瑜 Vs. 北大人口研究所教授乔晓春）

Waataa...

被禁止出口朝鮮的重型機械出現在了金正恩縂書記的胯下。在中國社交網絡上，大量商家公開曬出自家重型機械出口朝鮮的視頻，看來對朝鮮制裁的聯合國決議，也成了「歷史文件不具現實意義」。

标哥哪来这么多钱？是不是马云的白手套？

能力之外的资本等于零👍 王石自称在深圳有个外号叫“金手指”，就是你指什么就赚钱什么👍好厉害哟👍

美国国务卿卢比奥和儿子接受采访。卢比奥的儿子在佛罗里达大学打球，卢比奥说退休后想当海豚队主教练

1月19日，福建省泉州市，晋江加来盟鞋厂。工人反映：厂里采用计件制，却用计时器来测员工速度，速度快的工价会被降一半，而且没有提前通知，工人直到拿到工资单才发现。维权现场，有工人表示：“两千多块钱一个月，那我们还怎么干啊？”

Watch video

本站自动实时分享网络热点
24小时实时更新
所有言论不代表本站态度
欢迎对信息踊跃评论评分
评分越高，信息越新，排列越靠前

2

1

0

进入2024年，平板/手机终端LLM能力和半年前比，进步还是很明显的
半年前在iPhone/Galaxy上用GPU跑7B模型大概能到6 token/s，现在已经能接近20 token/s了
主要提升来自于两方面：一个是启用NPU优化提升到10 token/s，另外一个是新技术speculative decoding再提升一倍（原理如图）…
IT技术
( twitter.com )

2年前由 fin 提交

进入2024年，平板/手机终端LLM能力和半年前比，进步还是很明显的

半年前在iPhone/Galaxy上用GPU跑7B模型大概能到6 token/s，现在已经能接近20 token/s了

主要提升来自于两方面：一个是启用NPU优化提升到10 token/s，另外一个是新技术speculative decoding再提升一倍（原理如图）

NPU的优化主要是对带宽利用方面，压缩带宽之类的技术

speculative decoding则是巧妙的用一个小LLM先快速做一轮下一个单词的预测，然后用大LLM来同步验证，速度会快一倍，这个技术现在应用也很广泛了

下一次芯片LLM能力主要升级估计是一年半之后，毕竟从去年LLM大火开始构思新架构到面世，通常需要两年的时间

至于升级的部分，我猜测可能主要是带宽，这部分的升级对提升token数的作用是最大的

大胆预测一下，明年年底左右（2025年），随着各种芯片和各层底层软件的优化，我们应该可以看到LLaMa 3的7B模型在平板/手机/汽车上跑到40~50 token/s

那么7B就不再是手机终端的sweet point，也许2026之后会升级成主流13B的模型，占用8GB内存（感觉利好存储厂商）

那个时候的手机13B模型，可能会有今天GPT3.5的能力（现在最接近GPT3.5的小模型是Mistral 7X8模型），那就真的能做很多事情了

点击图片查看原图

1周内 1个月内 1年内全部时间

1
2
3
4
5
6
...
366
下一页

1

2

1

1

好家伙，能手机部署LLM大模型来了。MiniCPM: 是面壁智能与清华大学自然语言处理实验室共同开源的系列端侧大模型，MiniCPM-2B 仅有 24亿（2.4B）的非词嵌入参数量。与 Mistral-7B相近（中文、数学、代码能力更优），整体性能超越 Llama2-13B、MPT-30B、Falcon-40B 等模型。
IT技术
( github.com)

1年前 • Geek 0 评论

2

2

1

1

一进入2024年，果然不同反响——
时政
( twitter.com)

2年前 • 高伐林 0 评论

3

2

1

1

总感觉时代是个轮回
从00年代的图标3D化，再到10年代的扁平化，再到重回3D
手机也是，从大到小再到大，从厚到薄再到厚，从重到轻再到yt
什么时候3.5mm耳机孔才能再次出现在高端手机上？
时政
( twitter.com)

2年前 • 柑橘小波奇🐱🎄 0 评论

4

2

1

1

推荐一套The Full Stack的免费 LLM 在线教程：LLM Bootcamp - Spring 2023
包含了提示工程、LLM运维、LLM App开发、LLM基础等内容。
第一次访问需要输入邮箱。
IT技术
( fullstackdeeplearning.com)

2年前 • 宝玉 0 评论

5

2

1

1

Jim Fan 预言：距离机器人 AI 的 ChatGPT 时刻大约还有 3 年时间
以下为其推文转译：
除了大语言模型（LLM）之外，2024年最重大的领域无疑是机器人学。我们距离实体 AI 智能体实现 ChatGPT 式的突破仅有大约三年的时间。长期以来，我们一直受到莫拉维克悖论（Moravec's…
IT技术
( twitter.com)

2年前 • 宝玉 0 评论

6

2

1

1

AI iPhone前奏？苹果发表论文，提出“在手机内存上运行LLM（大语言模型）的方法”
大陆资讯
( wallstreetcn.com)

2年前 • 拉拉么 0 评论

7

2

1

1

1月31日，有博主“恶意回忆”了2016年人民日报的文章：中国预计从2024年开始进入高收入阶段。
时政
( twitter.com)

1年前 • 李老师不是你老师 0 评论

8

4

3

3

新年快乐！愿世界和平，邪恶终结！！
感谢推友们在 2023 年的支持。
祝乌克兰在 2024 年击败俄罗斯 ✊🇺🇦👊🎖️💪🎖️👊
时政
( twitter.com)

2年前 • 乌克兰战争•最新进展🇺🇦 0 评论

9

2

1

1

2024年，注定将是诡谲多变。俄乌战争势必延展到2025年，巴以战争会推进到2024年底。
这是美国目前确定，在2024年要面对的两条战线。2024年美国大选，必定会因民主党铁定羁押川普入狱，而纷争内起，如果被奥巴马掺入种族批判因素，动荡将会波及美国军队。…
时政
( twitter.com)

2年前 • 昆侖 0 评论

10

2

1

1

美的和格力各自的2024年年会。
时政
( twitter.com)

2年前 • 曹山石 0 评论

11

2

1

1

波士顿动力的机器人练习唱歌跳舞这么多年，终于开始进厂干活了。中间似乎还发了脾气
大陆资讯
( m.weibo.cn)

1年前 • 墙头看世界 0 评论

12

2

1

1

1月31日，中央网信办称，将开展2024年春节网络环境整治专项行动。其中，整治对象包括“利用年终盘点、返乡见闻等形式编造不实内容，渲染极端情绪”等。
时政
( twitter.com)

1年前 • Jacobson🌎🌸贴贴BOT 0 评论

13

2

1

1

这家外资行明年“离谱”预测来了，盛宝银行2024年十大惊人猜想：美国资本主义终结、油价翻倍、AI引爆欧美安全危机
大陆资讯
( wallstreetcn.com)

2年前 • 黄牛票 0 评论

14

2

1

1

快2024了，这些年轻人却用上了「老人机」
大陆资讯
( www.ifanr.com)

2年前 • 观摩团 0 评论

15

3

2

2

维吾尔人权项目即将举行的活动📢📢📢
《伊力哈木．土赫提：维吾尔和平推动者与 2024年诺贝尔和平奖》
📅2024年01月17日（周三）
⏲️美东时间早上10点至11点30分
🚏请至维吾尔人权项目
更多信息：
时政
( chinese.uhrp.org)

2年前 • 维吾尔人权项目 0 评论

16

2

1

1

“家书抵万金”。
近日有网友爆料称，浦发银行所有分行，年终奖化为一封家书。据悉，该行采取了基本工资加年终奖的模式。普通员工的年收入主要依赖于年终奖，这意味着整年的努力只能换来一封家书。有员工吐槽称，两天无法平静，百日攻坚连三月，一封家书抵万金。
时政
( twitter.com)

1年前 • 李老师不是你老师 0 评论

17

2

1

1

【加拿大收紧留学“闸门”】1月22日，加拿大移民、难民和公民部(IRCC)宣布，将在两年内限制进入该国的外国学生人数，以应对加拿大住房和医疗保健压力。据IRCC数据显示，2024年学签获批指标约36万份，同比减少35%。2025年的指标将在2024年底重新评估。
大陆资讯
( www.jiemian.com)

2年前 • 妹特思棒味 0 评论

18

2

1

1

习近平亲自指示：「哪怕一毫米领土也绝不让步，必须不断加强保护钓鱼岛主权的斗争」
这是他在2023年11月底时，对中国海警局下达的最新命令
受此影响，中国海警局计划自2024年起，每天都派船进入日本尖阁列岛海域，必要时还将进入日本渔船进行检查
据称，习认定钓鱼岛问题「只能前进，不许后退」
时政
( twitter.com)

2年前 • 纵横日本 0 评论

19

2

1

1

2024年的体育比赛终于有点上个世纪末科幻电影的感觉了
IT技术
( twitter.com)

2年前 • Bear Liu • 下载视频 0 评论

00:00:26

20

3

2

2

吉林大学：自2024年起停止高水平运动队招生
大陆资讯
( www.thepaper.cn)

2年前 • 三聚氰胺 0 评论

21

2

1

1

财政部终于发布了全年财政收支数据，放进数据表里，简单分析一下。
2023年中国总财政赤字水平达到了8.84万亿，史上第二高，仅次于新冠封控最残忍的2022年。
注意，2023年增值税全面补缴，因此财政公共预算收入还有比较明显的增长，21.68万亿，较2022年的20.37万亿，增幅6.4%。2024年没有了增值税补缴…
时政
( twitter.com)

1年前 • 老蛮频道 0 评论

22

2

1

1

2024年，極有可能迎來的社會現狀
时政
( twitter.com)

2年前 • 賣男孩的小火柴 0 评论

23

2

1

1

“非洲手机之王”传音年终奖涨30%？多名员工确认：至少多发5位数，年前到账
大陆资讯
( www.time-weekly.com)

2年前 • 吊死团 0 评论

24

2

1

1

2024年中国经济形势展望：亮点有一二，房地产衰竭，中国经济迈入全面性萧条。中国经济衰退，是结构所决定，绝非经济政策或者国家领袖意志所左右。认清楚这个趋势，就能非常清晰的预判2024年中国经济，会在房地产全面衰竭后，陷入全局性萧条。经济步入大通缩的结论，也最终会被官方公开认可，以此降低所…
时政
( twitter.com)

2年前 • 昆侖 0 评论

1
2
3
4
5
6
...
366
下一页

0.06709 Second , Gzip Enable.本网所有言论均来自网络，不代表本网站立场。联系方式: [email protected]

©2012.11.21 bad.news All rights reserved. 社区自动运营第 -- 年零 -- 天
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

关注推特