Bad.
news
短视频
长视频
日本 AV
H 动漫
新闻
每日热点
下载 免费看片 App
更多
安全事故
年度热点
新闻快照
加入电报群
成人动漫
评论
相关内容
登录
|
繁體
搜成人🔞
搜新闻📰
最近搜索:
登录
分享一个链接
发表一篇文章
任何有趣的,图片,热点新闻,视频,文字...
9296
位用户此时在线
关注推特
收听电报
24小时点击排行 Top 10:
本站自动实时分享网络热点
24小时实时更新
所有言论不代表本站态度
欢迎对信息踊跃评论评分
评分越高,信息越新,排列越靠前
2
1
0
为什么苹果的 LLM 大语言模型叫做 AJAX?
媒体说苹果正在测试人工智能聊天机器人,但不知道拿它干嘛。这个工具被苹果内部称为 Apple GPT,使用了苹果自己的 AJAX 大语言模型
因为它使用 Google JAX 构建,所以就叫 Apple JAX 简称 AJAX?命名果然是 CS 领域的第二大难题
IT技术
(
www.theverge.com
)
2年前
由
倪爽
提交
分享到
点击图片查看原图
排序方式(相对时间):
1周内
1个月内
1年内
全部时间
1
2
3
4
5
6
...
400
下一页
1
2
1
1
LLM 大语言模型,什么时候能摘掉「法学硕士」的帽子?
大陆资讯
(
www.myzaker.com
)
2年前
•
地沟油
•
--
点击
0 评论
分享到
闪电预览
2
2
1
1
AI iPhone前奏?苹果发表论文,提出“在手机内存上运行LLM(大语言模型)的方法”
大陆资讯
(
wallstreetcn.com
)
2年前
•
拉拉么
•
--
点击
0 评论
分享到
闪电预览
3
2
1
1
推荐阅读:《现代大语言模型架构 [译]》
GitHub 的官方博客内容:The architecture of today’s LLM applications,介绍了现在如果要基于大语言模型构建应用,常见的架构是什么样的。
IT技术
(
baoyu.io
)
2年前
•
宝玉
•
--
点击
0 评论
分享到
4
1
0
0
大型语言模型与生成式AI——介绍LLM和生成式AI项目的生命周期7——用Transformer生成文本
#大型语言模型与生成式AI… …
IT技术
(
twitter.com
)
2年前
•
宝玉
•
--
点击
0 评论
分享到
5
2
1
1
一篇有意思的论文:《战争与和平 (WarAgent): 基于大语言模型的多智能体世界大战模拟》
论文展示了如何利用大语言模型 (LLM) 模拟复杂的人类行为
大语言模型在模拟人类冲突和细腻行为方面展现出了令人着迷的应用潜力,特别是通过多智能体 AI 系统实现。
我们可以通过对 LLM…
IT技术
(
twitter.com
)
2年前
•
宝玉
•
--
点击
0 评论
分享到
6
2
1
1
一个主流大型语言模型(LLM)API 价格比较网站,原来很多白嫖模型是收费的啊。
IT技术
(
llmpricecheck.com
)
1年前
•
Geek
•
--
点击
0 评论
分享到
7
2
1
1
这篇医疗保健领域LLM调研的论文详细,介绍了医疗保健领域主要的一些模型的效果和相关进展:
💊从语言表示模型(PLM)到大模型(LLM)发生了重大转变,标志着从判别式人工智能到生成式人工智能的转型,以及从以模型为中心到以数据为中心的转型。…
IT技术
(
twitter.com
)
2年前
•
歸藏
•
--
点击
0 评论
分享到
8
2
1
1
这个人的理论很有意思
总而言之,为什么之前所有用简单RL实现模型推理的工作都失效了,但DeepSeek却能一夜之间成功?到底发生了什么?
他的理论是:因为过去2年,LLM崛起之后,人们在LLM上进行了大量的CoT(思维链)工作;这些工作混入了现在的训练数据里,改变了新训练大语言模型的行为
时政
(
twitter.com
)
11个月前
•
勃勃OC
•
--
点击
0 评论
分享到
9
2
1
1
昨天湾区GPTDAO线下大预言模型LLM技术交流研讨会在Palo Alto举行 大家讨论的很热烈,并聆听有经验的垂类大模型技术专家做了分享,简单记录如下:
标题:揭秘大型语言模型训练流程……
IT技术
(
twitter.com
)
2年前
•
GPTDAOCN
•
--
点击
0 评论
分享到
10
2
1
1
#AI开源项目推荐:privateGPT
基于私有LLM(大语言模型)做个人的文档问答,不必担心隐私泄露
技术栈是 LangChain 和 GPT4All
- LLM默认用的 ggml-model-q4_0.bin.
- Em…
IT技术
(
twitter.com
)
2年前
•
宝玉
•
--
点击
0 评论
分享到
11
2
1
1
这是苹果对于 Apple Intelligence 背后技术的介绍视频,结合引用的 的推文信息,他们的模型分成三层:
1. 本地模型
这部分包含语言模型和扩散模型,另外还有用来做 RAG 的 Semantic Index (语义索引)和 App Intents Toolbox(应用意图工具箱)。
其中语言模型是 3B…
IT技术
(
twitter.com
)
1年前
•
宝玉
•
--
点击
•
下载视频
0 评论
分享到
Your browser does not support the video tag.
00:06:19
12
2
1
1
转译:《苹果公司于 10 月份悄然发布了一款开源多模态 LLM》
苹果公司在2023年10月低调发布了一款名为Ferret的开源多模态大语言模型,这是苹果与哥伦比亚大学研究人员的合作成果。当时,尽管发布包括了代码和权重(仅限研究用途,不包含商业许可),但并未引起太多关注。然而,随着近期 Mistral…
IT技术
(
twitter.com
)
2年前
•
宝玉
•
--
点击
0 评论
分享到
13
2
1
1
部署在树莓派 (Raspberry Pi)上 GPT 语音助手,使用开源的大型语言模型(LLM)响应请求,转给爱折腾的小伙伴。
IT技术
(
github.com
)
1年前
•
Geek
•
--
点击
0 评论
分享到
14
1
0
0
a16z:大语言模型(LLM)的新兴架构(万字长文)🧶
大型语言模型是构建软件的一种新强大工具。但由于它们如此新颖,且与常规计算资源的行为方式大不相同,因此如何使用它们并不总是显…
IT技术
(
twitter.com
)
2年前
•
GPTDAOCN
•
--
点击
0 评论
分享到
15
1
0
0
斯坦福发布最新大模型排行榜
来自斯坦福的团队,发布了一款LLM自动评测系统——AlpacaEval,以及对应的AlpacaEval Leaderboard。这个全新的大语言模型排行榜 AlpacaEval,它是一种基于 LLM…
IT技术
(
twitter.com
)
2年前
•
GPTDAOCN
•
--
点击
0 评论
分享到
16
2
1
1
Andrej Karpathy 在YouTube上发布了一段新视频,时长3小时31分钟:
《深入探讨大型语言模型(LLM)如ChatGPT》
IT技术
(
twitter.com
)
10个月前
•
宝玉
•
--
点击
0 评论
分享到
17
2
1
1
推荐阅读:《我们在使用大语言模型 (LLMs) 构建产品一年中的经验总结 (第一部分) [译]》
文章主要分享了大语言模型核心组件的最佳实践,包括提示词设计、对 LLM 输出结果的评估,什么时候该用 RAG 还是微调等等。
一、提示词设计
1. n-shot 多样例
在提示词中加入 5
IT技术
(
twitter.com
)
1年前
•
宝玉
•
--
点击
0 评论
分享到
18
2
1
1
为什么大语言模型数学那么差都不能数清楚文本有多少单词?为什么连单词反转这样简单的事都做不好?
因为大语言模型只是根据预训练的结果预测 Token,所以它很难通过预测数清楚有多少单词。
正确的做法是借助外部工具,例如 GPT-4 会调用 Code Interpreter 写一段代码运行来借助代码算清楚。
IT技术
(
twitter.com
)
1年前
•
宝玉
•
--
点击
•
下载视频
0 评论
分享到
Your browser does not support the video tag.
00:03:19
19
2
1
1
大语言模型微调之道1——介绍
#大语言模型微调之道
欢迎来到由Sharon Zhou主讲的《大语言模型微调之道》课程。这门课程将教你如何在自己的数据上进一步训练开源LLM。
虽然你可能已经知道如何提示一个大语言模型,但这门课程会深入讲解另一个重要工具:微调。…
IT技术
(
twitter.com
)
2年前
•
宝玉
•
--
点击
•
下载视频
0 评论
分享到
Your browser does not support the video tag.
00:02:59
20
2
1
1
Andrej Karpathy:
相比起“提示工程”(prompt engineering),我更倾向使用“上下文工程”(context engineering)这个词。
为什么呢?
因为大多数人一想到“提示”,就联想到我们日常跟大语言模型(LLM)互动时,输入的那些短小的任务描述或问题。而在工业级的 LLM
IT技术
(
twitter.com
)
6个月前
•
宝玉
•
--
点击
0 评论
分享到
21
2
1
1
“有什么、做什么、怎么做” 确实是提示词的精髓👍
有什么:给模型的上下文
做什么:给模型指令
怎么做:【可选】思维链
我现在和 o1 对话时,大多数时候不会加“怎么做”,因为模型有时候比我聪明,方案比我更好,如果我加了“怎么做”反而约束了模型的发挥。当然如果结果不好,可以进一步引导“怎么办”
IT技术
(
twitter.com
)
1年前
•
宝玉
•
--
点击
0 评论
分享到
22
2
1
1
谷歌一个看似微小,实则影响巨大的变动
上个月,谷歌悄悄地移除了 num=100 这个搜索参数。
这意味着,你再也不能一次性查看 100 条搜索结果了。现在,默认的上限是 10 条。
这事儿为什么这么重要? * 市面上绝大多数的大语言模型 (LLM),比如 OpenAI 的模型和
IT技术
(
twitter.com
)
2个月前
•
宝玉
•
--
点击
0 评论
分享到
23
2
1
1
又来挖坑了,开始翻译《LangChain for LLM Application Development 基于LangChain的大语言模型应用开发》
第1集 Introduction 介绍…
IT技术
(
twitter.com
)
2年前
•
宝玉
•
--
点击
0 评论
分享到
24
3
2
2
世界模型的概念是 Runway 先提出来的(至少从公开的信息来看),他们想打造一个超越纯文本大语言模型的世界模型,融合文本、音频、图像和视频,让模型自己拥有自己的心智图谱,理解真实世界的样子,探索世界中的“为什么”和“怎么办”。
结果 OpenAI 做了 Runway 想做还没做好的事情………
IT技术
(
twitter.com
)
1年前
•
宝玉
•
--
点击
•
下载视频
0 评论
分享到
Your browser does not support the video tag.
00:03:37
1
2
3
4
5
6
...
400
下一页
创建一个新帐户
只需要几秒!
用户名:
电子邮件:
(必填)
密码:
输入验证码:
点此刷新
创建帐户
登录
已拥有账号并想要登录?
用户名:
密码:
登陆
忘记密码?