首页
学习
活动
专区
圈层
工具
发布

#token

当Agent开始“吃”Token,AI时代需要怎样的“运输线”?

Alter聊科技

从早期一问一答的对话,到自主执行、深度协同的Agent,AI正全面进入人类的生活和生产系统。

5010

一篇讲透 Agent:Token、Skill、RAG、MCP、SDD、Harness

java金融

上周有个朋友拿着一个 Agent 项目来问我。 他做的是代码变更助手:用户提一句“给订单模块加一个优惠券核销能力”,Agent 自动读代码、查接口文档、改代码、...

5310

ollama v0.30.2 正式发布:自动安装 Cline CLI、Radeon 核显兼容、缓存 Token 统计、llama.cpp 升级完整实测文档

福大大架构师每日一题

Ollama v0.30.2于2026年6月3日正式上线,本次版本累计提交15次代码变更,修改38个代码文件,包含安全漏洞修复、llama.cpp内核版本升级、...

40820

4 个月烧光全年预算:Uber 紧急叫停背后的“Token 经济学”危机与架构自救

随机比特

腾讯 | 高级前端工程师 (已认证)

当所有大厂都在鼓吹“给每个程序员配个 AI Copilot 就能提效 50%”的宏大叙事时,现实的铁拳狠狠地砸了下来。

19010

企业同时用多个国产大模型,如何接入成本最低?

用户7013336

2026 年,国产大模型已全面进入"多模型并行"时代。一家企业的 AI 产品往往需要同时接入多个模型做推理、创作、视频生成——但每家厂商的 API 格式、认证方...

11010

月烧33亿之后,Token管理不该是事后补课

用户12501872

某家企业单月支付给Anthropic的Claude使用费用,折合人民币超过33亿元。

8910

【养虾那些事 06】每发1条消息,偷偷扣你「 10 倍」的钱?价值千元的小白降token手册

用户1589488

今天,「养虾那些事」我们来深度透视token如何被消耗的,有什么方法解决“养不起”虾的问题。

12910

LLM驱动的自动化渗透测试:基于13个框架与15亿Token的实证效能评估

IT资讯研究所

腾讯科技 | 研究员 (已认证)

四川大学、清华大学、腾讯安全团队等联合发布《Hackers or Hallucinators?》论文,基于13个开源AutoPT框架、15亿Token消耗及15...

13910

是时候学装B了,大佬们都在说的Effort(思考力度旋钮)是个啥?

乐小野

石化盈科信息技术有限责任公司 | 算法工程师 (已认证)

【出处】Anthropic API release notes 写明:effort 现已 GA,并在新模型上“替代 budget_tokens 控制思考深度”。

9810

【AI内参】SciMaster:突破 20 万 Token 瓶颈,ML-Master 2.0 开启“长程自主科学”新纪元

乐小野

石化盈科信息技术有限责任公司 | 算法工程师 (已认证)

数据亮点:在处理如“Random Acts of Pizza”这类极其复杂的科研任务时,通过 HCC 治理,系统成功将峰值上下文从超过200k tokens压缩...

10510

Google放了个大的:Flash干翻Pro,每月烧掉3200万亿token

老周聊架构

另一方面,token量≠价值量。一个用户反复问"今天天气怎么样"产生的token,和一个开发者用Agent完成复杂任务产生的token,含金量完全不同。

13610

Claude Code 在国内难用?OpenClaw + TokenHub Token Plan 是国产可选方案

gavin1024

摘要: Claude Code 在国内访问稳定性与计费方式上常给开发者带来不少摩擦,OpenClaw 作为开源的国产 CLI 编程工具与腾讯云 TokenHub...

23110

通用 Token Plan 与 Hy Token Plan 怎么搭配:限购 1+1 规则与抵扣顺序

gavin1024

摘要: 腾讯云 TokenHub 允许同一主账号同时持有 1 个通用 Token Plan 和 1 个 Hy Token Plan,共用一把 API Key,由...

20110

Token Plan 进阶套餐 299 元 3.2 亿 Tokens:定价与抵扣规则解读

gavin1024

摘要: 腾讯云 TokenHub 通用 Token Plan 进阶套餐 299 元/月、月度 3.2 亿 Tokens 配额,覆盖 GLM、Kimi、MiniM...

31010
领券