为什么苹果的 LLM 大语言模型叫做 AJAX？媒体说苹果正在测试人工智能聊天机器人，但不知道拿它干嘛。这个工具被苹果内部称为 Apple GPT，使用了苹果自己的 AJAX 大语言模型因为它使用 Google JAX 构建，所以就叫 Apple JAX 简称 AJAX？命名果然是 CS 领域的第二大难题

分享一个链接

发表一篇文章

任何有趣的，图片，热点新闻，视频，文字...

3391 位用户此时在线

关注推特

收听电报

24小时点击排行 Top 10：

转载自抖音。唉，中国普通人的一生啊。 👤 来自: 留学生 8964

12月30日，中国青年报发表特朗普对解放军绕军演表态，引发评论区十万网友集体刷表情包嘲讽

蔡磊渐冻症病情接近终末期 12月30日，据多家媒体报道，京东前副总裁蔡磊确诊渐冻症已超过6年。他通过媒体发布一段视频，记录了自己在彻底“失声”前所说的一段话。

两个宝马女司机的终极对决，谁打赢了辫子帅哥跟谁回家😂

受益终身的良性循环学习法

As the PLA stages high-profile exercises around Taiwan to project strength and preserve political face, many women in neglected urban villages are left to survive in informal and often exploitative conditions. These two extremes form a stark contrast. On one side, carefully

网友太有才了，复活邓小平与习对话，让流氓本质曝露于天下。

12月30日，伊朗的抗议活动正在升级，学生们正在领导革命。

教师成剩女主力军！40岁大龄剩女风华正茂，听听这位美女怎么说！

美国在委内瑞拉进行首次陆地打击

张朝阳：“多么希望我二十岁的时候有人告诉我这个道理！”

12月29日，台湾防务部门29日发布声明表示，针对当日解放军飞机及海军舰艇相关活动，台湾方面已掌握动态，并依法依规展开应对。

“一场烟民的集体戒烟宣言” 近日，众多烟民在网络上发视频宣布集体戒烟。他们表示，自己抽的烟交的税已经不再是“射向敌人的子弹”，而是“射向自己的子弹”，不仅伤肺还伤心。同时呼吁大家团结戒烟，为了不养这帮“孙子”。

12月29日，广西省钦州市，钦州港华谊化工欠薪，工人讨薪。 12月29日，山西省太原市，迎泽区，王家峰南街2号，龙投大厦欠薪，工人讨薪。 12月29日，江苏省常州市钟楼区，企业欠薪，工人前往北港街道综治中心讨薪。 12月29日，湖北省孝感市汉川市，服装城F2期2--3号亚尔凡服饰欠薪，工人讨薪。#维权

重庆有个“景点”叫李子坝，去那里都这样打卡。

这份年终众包调研来自我在 X 上的随手一问，问了三个问题：2025 年 AI 最关键的技术突破是什么？哪些产品让你眼前一亮？2026 年什么趋势不可忽视？没想到收到了这么多认真的回复。我花了一两个小时时间，把这些留言和答案汇总整理了一下。 127 条留言，95 个人回答了同样的三个问题。

不要怀疑有钱人的智商——80岁王刚卖掉5亿四合院，移民美国养老！他说：累了，不想再经营了！

把笛子吹进了紫竹院虽然撂的是“野摊儿”，但姑娘的水平是专业科班，不仅水平高，性格也好

12月26日，70多岁的河南村镇银行储户蔡广丽前往河南讨要存款，给老伴看病。由于没钱住旅店，只能半夜露宿街头等车。

😃😅 zeeler得有多客观啊！这数据源👍

财政部老爷们：近两年买房的，亏得裤子都没有了，你还想征收增值税？你们是猴子派来的吗？😂😂

网友投稿: 南京中山陵石桥桥洞现场情况 12月30日晚，有网友前往江苏南京中山陵石桥桥洞实地查看。其称，桥洞在下游一侧被砖块封堵，洞内积水但未完全封死。该网友表示，当晚前往途中未见人员值守，也未设置围栏，进入与离开均畅通无阻；桥洞内水深不足40厘米，未过膝，现场拍摄后顺利返回。

匿名投稿：抖音上最近流行出一种评论区玩法，在代码中间输入任何字符发出去后会消失，如果我们输入“习近平”三个字会怎样呢？答案是：消失🤣🤣🤣

56岁的未婚小仙女🧚‍♀️，在医院后悔的嚎啕大哭～～😂

许小年：你把佳能拿回去砸开来看，你也造不出来。

本站自动实时分享网络热点
24小时实时更新
所有言论不代表本站态度
欢迎对信息踊跃评论评分
评分越高，信息越新，排列越靠前

为什么苹果的 LLM 大语言模型叫做 AJAX？

媒体说苹果正在测试人工智能聊天机器人，但不知道拿它干嘛。这个工具被苹果内部称为 Apple GPT，使用了苹果自己的 AJAX 大语言模型

因为它使用 Google JAX 构建，所以就叫 Apple JAX 简称 AJAX？命名果然是 CS 领域的第二大难题


IT技术
( www.theverge.com )

2年前由倪爽提交

点击图片查看原图

1周内 1个月内 1年内全部时间

AI iPhone前奏？苹果发表论文，提出“在手机内存上运行LLM（大语言模型）的方法”
大陆资讯
( wallstreetcn.com)

2年前 • 拉拉么 • -- 点击 0 评论

闪电预览

LLM 大语言模型，什么时候能摘掉「法学硕士」的帽子？
大陆资讯
( www.myzaker.com)

2年前 • 地沟油 • -- 点击 0 评论

闪电预览

推荐阅读：《现代大语言模型架构 [译]》
GitHub 的官方博客内容：The architecture of today’s LLM applications，介绍了现在如果要基于大语言模型构建应用，常见的架构是什么样的。
IT技术
( baoyu.io)

2年前 • 宝玉 • -- 点击 0 评论

大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期7——用Transformer生成文本

#大型语言模型与生成式AI… …
IT技术
( twitter.com)

2年前 • 宝玉 • -- 点击 0 评论

一篇有意思的论文：《战争与和平 (WarAgent): 基于大语言模型的多智能体世界大战模拟》
论文展示了如何利用大语言模型 (LLM) 模拟复杂的人类行为
大语言模型在模拟人类冲突和细腻行为方面展现出了令人着迷的应用潜力，特别是通过多智能体 AI 系统实现。
我们可以通过对 LLM…
IT技术
( twitter.com)

2年前 • 宝玉 • -- 点击 0 评论

一个主流大型语言模型（LLM）API 价格比较网站，原来很多白嫖模型是收费的啊。
IT技术
( llmpricecheck.com)

1年前 • Geek • -- 点击 0 评论

这篇医疗保健领域LLM调研的论文详细，介绍了医疗保健领域主要的一些模型的效果和相关进展：

💊从语言表示模型(PLM)到大模型(LLM)发生了重大转变,标志着从判别式人工智能到生成式人工智能的转型,以及从以模型为中心到以数据为中心的转型。…
IT技术
( twitter.com)

2年前 • 歸藏 • -- 点击 0 评论

这个人的理论很有意思
总而言之，为什么之前所有用简单RL实现模型推理的工作都失效了，但DeepSeek却能一夜之间成功？到底发生了什么？
他的理论是：因为过去2年，LLM崛起之后，人们在LLM上进行了大量的CoT（思维链）工作；这些工作混入了现在的训练数据里，改变了新训练大语言模型的行为
时政
( twitter.com)

11个月前 • 勃勃OC • -- 点击 0 评论

昨天湾区GPTDAO线下大预言模型LLM技术交流研讨会在Palo Alto举行大家讨论的很热烈，并聆听有经验的垂类大模型技术专家做了分享，简单记录如下：

标题：揭秘大型语言模型训练流程……
IT技术
( twitter.com)

2年前 • GPTDAOCN • -- 点击 0 评论

#AI开源项目推荐：privateGPT

基于私有LLM（大语言模型）做个人的文档问答，不必担心隐私泄露

技术栈是 LangChain 和 GPT4All
- LLM默认用的 ggml-model-q4_0.bin.
- Em…
IT技术
( twitter.com)

2年前 • 宝玉 • -- 点击 0 评论

这是苹果对于 Apple Intelligence 背后技术的介绍视频，结合引用的的推文信息，他们的模型分成三层：
1. 本地模型
这部分包含语言模型和扩散模型，另外还有用来做 RAG 的 Semantic Index (语义索引)和 App Intents Toolbox（应用意图工具箱）。
其中语言模型是 3B…
IT技术
( twitter.com)

1年前 • 宝玉 • -- 点击 • 下载视频 0 评论

00:06:19

转译：《苹果公司于 10 月份悄然发布了一款开源多模态 LLM》
苹果公司在2023年10月低调发布了一款名为Ferret的开源多模态大语言模型，这是苹果与哥伦比亚大学研究人员的合作成果。当时，尽管发布包括了代码和权重（仅限研究用途，不包含商业许可），但并未引起太多关注。然而，随着近期 Mistral…
IT技术
( twitter.com)

2年前 • 宝玉 • -- 点击 0 评论

部署在树莓派 (Raspberry Pi)上 GPT 语音助手，使用开源的大型语言模型（LLM）响应请求，转给爱折腾的小伙伴。
IT技术
( github.com)

1年前 • Geek • -- 点击 0 评论

a16z：大语言模型（LLM）的新兴架构（万字长文）🧶

大型语言模型是构建软件的一种新强大工具。但由于它们如此新颖，且与常规计算资源的行为方式大不相同，因此如何使用它们并不总是显…
IT技术
( twitter.com)

2年前 • GPTDAOCN • -- 点击 0 评论

斯坦福发布最新大模型排行榜

来自斯坦福的团队，发布了一款LLM自动评测系统——AlpacaEval，以及对应的AlpacaEval Leaderboard。这个全新的大语言模型排行榜 AlpacaEval，它是一种基于 LLM…
IT技术
( twitter.com)

2年前 • GPTDAOCN • -- 点击 0 评论

Andrej Karpathy 在YouTube上发布了一段新视频，时长3小时31分钟：
《深入探讨大型语言模型（LLM）如ChatGPT》
IT技术
( twitter.com)

10个月前 • 宝玉 • -- 点击 0 评论

推荐阅读：《我们在使用大语言模型 (LLMs) 构建产品一年中的经验总结 (第一部分) [译]》
文章主要分享了大语言模型核心组件的最佳实践，包括提示词设计、对 LLM 输出结果的评估，什么时候该用 RAG 还是微调等等。
一、提示词设计
1. n-shot 多样例
在提示词中加入 5
IT技术
( twitter.com)

1年前 • 宝玉 • -- 点击 0 评论

为什么大语言模型数学那么差都不能数清楚文本有多少单词？为什么连单词反转这样简单的事都做不好？
因为大语言模型只是根据预训练的结果预测 Token，所以它很难通过预测数清楚有多少单词。
正确的做法是借助外部工具，例如 GPT-4 会调用 Code Interpreter 写一段代码运行来借助代码算清楚。
IT技术
( twitter.com)

1年前 • 宝玉 • -- 点击 • 下载视频 0 评论

00:03:19

大语言模型微调之道1——介绍

#大语言模型微调之道

欢迎来到由Sharon Zhou主讲的《大语言模型微调之道》课程。这门课程将教你如何在自己的数据上进一步训练开源LLM。

虽然你可能已经知道如何提示一个大语言模型，但这门课程会深入讲解另一个重要工具：微调。…
IT技术
( twitter.com)

2年前 • 宝玉 • -- 点击 • 下载视频 0 评论

00:02:59

Andrej Karpathy：
相比起“提示工程”（prompt engineering），我更倾向使用“上下文工程”（context engineering）这个词。
为什么呢？
因为大多数人一想到“提示”，就联想到我们日常跟大语言模型（LLM）互动时，输入的那些短小的任务描述或问题。而在工业级的 LLM
IT技术
( twitter.com)

6个月前 • 宝玉 • -- 点击 0 评论

“有什么、做什么、怎么做” 确实是提示词的精髓👍
有什么：给模型的上下文
做什么：给模型指令
怎么做：【可选】思维链
我现在和 o1 对话时，大多数时候不会加“怎么做”，因为模型有时候比我聪明，方案比我更好，如果我加了“怎么做”反而约束了模型的发挥。当然如果结果不好，可以进一步引导“怎么办”
IT技术
( twitter.com)

1年前 • 宝玉 • -- 点击 0 评论

谷歌一个看似微小，实则影响巨大的变动
上个月，谷歌悄悄地移除了 num=100 这个搜索参数。
这意味着，你再也不能一次性查看 100 条搜索结果了。现在，默认的上限是 10 条。
这事儿为什么这么重要？ * 市面上绝大多数的大语言模型 (LLM)，比如 OpenAI 的模型和
IT技术
( twitter.com)

2个月前 • 宝玉 • -- 点击 0 评论

又来挖坑了，开始翻译《LangChain for LLM Application Development 基于LangChain的大语言模型应用开发》

第1集 Introduction 介绍…
IT技术
( twitter.com)

2年前 • 宝玉 • -- 点击 0 评论

世界模型的概念是 Runway 先提出来的（至少从公开的信息来看），他们想打造一个超越纯文本大语言模型的世界模型，融合文本、音频、图像和视频，让模型自己拥有自己的心智图谱，理解真实世界的样子，探索世界中的“为什么”和“怎么办”。
结果 OpenAI 做了 Runway 想做还没做好的事情………
IT技术
( twitter.com)

1年前 • 宝玉 • -- 点击 • 下载视频 0 评论

00:03:37

IT技术

AI iPhone前奏？苹果发表论文，提出“在手机内存上运行LLM（大语言模型）的方法” 大陆资讯 ( wallstreetcn.com)

大陆资讯

LLM 大语言模型，什么时候能摘掉「法学硕士」的帽子？ 大陆资讯 ( www.myzaker.com)

大陆资讯

推荐阅读：《现代大语言模型架构 [译]》 GitHub 的官方博客内容：The architecture of today’s LLM applications，介绍了现在如果要基于大语言模型构建应用，常见的架构是什么样的。 IT技术 ( baoyu.io)

IT技术

大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期7——用Transformer生成文本 #大型语言模型与生成式AI… … IT技术 ( twitter.com)

IT技术

IT技术

一个主流大型语言模型（LLM）API 价格比较网站，原来很多白嫖模型是收费的啊。 IT技术 ( llmpricecheck.com)

IT技术

IT技术

时政

昨天湾区GPTDAO线下大预言模型LLM技术交流研讨会在Palo Alto举行 大家讨论的很热烈，并聆听有经验的垂类大模型技术专家做了分享，简单记录如下： 标题：揭秘大型语言模型训练流程…… IT技术 ( twitter.com)

IT技术

#AI开源项目推荐：privateGPT 基于私有LLM（大语言模型）做个人的文档问答，不必担心隐私泄露 技术栈是 LangChain 和 GPT4All - LLM默认用的 ggml-model-q4_0.bin. - Em… IT技术 ( twitter.com)

IT技术

IT技术

IT技术

部署在树莓派 (Raspberry Pi)上 GPT 语音助手，使用开源的大型语言模型（LLM）响应请求，转给爱折腾的小伙伴。 IT技术 ( github.com)

IT技术

a16z：大语言模型（LLM）的新兴架构（万字长文）🧶 大型语言模型是构建软件的一种新强大工具。但由于它们如此新颖，且与常规计算资源的行为方式大不相同，因此如何使用它们并不总是显… IT技术 ( twitter.com)

IT技术

斯坦福发布最新大模型排行榜 来自斯坦福的团队，发布了一款LLM自动评测系统——AlpacaEval，以及对应的AlpacaEval Leaderboard。这个全新的大语言模型排行榜 AlpacaEval，它是一种基于 LLM… IT技术 ( twitter.com)

IT技术

Andrej Karpathy 在YouTube上发布了一段新视频，时长3小时31分钟： 《深入探讨大型语言模型（LLM）如ChatGPT》 IT技术 ( twitter.com)

IT技术

IT技术

IT技术

IT技术

IT技术

IT技术

IT技术

又来挖坑了，开始翻译《LangChain for LLM Application Development 基于LangChain的大语言模型应用开发》 第1集 Introduction 介绍… IT技术 ( twitter.com)

IT技术

IT技术

创建一个新帐户

登录

AI iPhone前奏？苹果发表论文，提出“在手机内存上运行LLM（大语言模型）的方法”
大陆资讯
( wallstreetcn.com)

LLM 大语言模型，什么时候能摘掉「法学硕士」的帽子？
大陆资讯
( www.myzaker.com)

推荐阅读：《现代大语言模型架构 [译]》
GitHub 的官方博客内容：The architecture of today’s LLM applications，介绍了现在如果要基于大语言模型构建应用，常见的架构是什么样的。
IT技术
( baoyu.io)

大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期7——用Transformer生成文本

#大型语言模型与生成式AI… …
IT技术
( twitter.com)

一个主流大型语言模型（LLM）API 价格比较网站，原来很多白嫖模型是收费的啊。
IT技术
( llmpricecheck.com)

昨天湾区GPTDAO线下大预言模型LLM技术交流研讨会在Palo Alto举行大家讨论的很热烈，并聆听有经验的垂类大模型技术专家做了分享，简单记录如下：

标题：揭秘大型语言模型训练流程……
IT技术
( twitter.com)

#AI开源项目推荐：privateGPT

基于私有LLM（大语言模型）做个人的文档问答，不必担心隐私泄露

技术栈是 LangChain 和 GPT4All
- LLM默认用的 ggml-model-q4_0.bin.
- Em…
IT技术
( twitter.com)

部署在树莓派 (Raspberry Pi)上 GPT 语音助手，使用开源的大型语言模型（LLM）响应请求，转给爱折腾的小伙伴。
IT技术
( github.com)

a16z：大语言模型（LLM）的新兴架构（万字长文）🧶

大型语言模型是构建软件的一种新强大工具。但由于它们如此新颖，且与常规计算资源的行为方式大不相同，因此如何使用它们并不总是显…
IT技术
( twitter.com)

斯坦福发布最新大模型排行榜

来自斯坦福的团队，发布了一款LLM自动评测系统——AlpacaEval，以及对应的AlpacaEval Leaderboard。这个全新的大语言模型排行榜 AlpacaEval，它是一种基于 LLM…
IT技术
( twitter.com)

Andrej Karpathy 在YouTube上发布了一段新视频，时长3小时31分钟：
《深入探讨大型语言模型（LLM）如ChatGPT》
IT技术
( twitter.com)

又来挖坑了，开始翻译《LangChain for LLM Application Development 基于LangChain的大语言模型应用开发》

第1集 Introduction 介绍…
IT技术
( twitter.com)