site stats
刚深扒了一下 MiroThinker 1.5,他们这套 Agent 压缩方式有点邪门,但看懂了觉得确实有用。核心解决的是「怎么在 256K 上下文里塞进去 400 次 Tool Use」的问题。他们做了一个极其大胆的操作:对ReAct历史上 think-action-observation 中的的 Observation(工具返回结果)进行物理掩码。除了最近 K
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: