首页
学习
活动
专区
圈层
工具
发布

#LLM

实战复盘:如何用 WorkBuddy + Playwright 搭建新西兰 CW 折扣监控自动化团队

用户12463021

在做 Chemist Warehouse (CW) 保健品折扣速递项目时,我们面临的最大痛点是信息差。好价往往持续几个小时,靠人工 24 小时盯着官网刷新效率极...

3300

【万字长文】LLM 缓存这笔账,藏着多少猫腻?

用户1127067

从 Claude、OpenAI、DeepSeek,到 Coding Agent、中转站和 AI Gateway 的成本黑箱

7110

基于RK182X边缘端大模型本地化推理的算力扩容技术方案解析

飞凌嵌入式

随着大语言模型与多模态融合技术在边缘场景的深度落地,储能监测、工业网关、自主机器人、边缘视频分析等终端设备,对本地离线推理、低延时实时响应、数据本地化闭环处理的...

4110

WorkBuddy 智能体成本控制与架构实践

山野大叔

在开发「语义显微镜 V3.0」和「brainproto 类脑原型」两个项目的过程中,验证了一个结论:

6610

图灵奖得主 Sutton 泼下冷水:放弃执迷“世界副本”,AI 的下一站是「生成认知」

螺丝厂灵儿呀

当前,从能够处理超长上下文的大语言模型(LLM),到以假乱真的视频生成模型,再到各类自主规划的 Agent 框架,AI 的能力边界似乎每天都在以指数级向外拓张。...

5210

从知识调用到智能体构建:qKnow 智能体构建平台v3.0 企业级 Bot 生产体系深度解析

吴同

导语: 大模型技术迅猛发展,但企业落地时仍面临知识库能力单一、模型切换困难、内部数据适配差等挑战。腾讯云生态伙伴 qKnow 推出智能体构建平台专业版 v3.0...

10510

RAG系列:#6 一文搞懂RAG存储技术:文件、元数据、切片、向量

AI-Frontiers

原文链接:https://mp.weixin.qq.com/s/gs-yR2R-ZTJeYx0r2ow1PA

13410

微软开源!13.8万 Star!一键把所有文件秒变 LLM 完美 Markdown!

开源星探

前两天还在跟朋友吐槽,现在做 AI 相关的工作,80% 的时间都花在数据清洗和格式转换上。

20610

从「更会写」到「敢合并」:AI 编程可闭环协作方法论

小小猪排画中游

AI 写代码的交付质量,常见瓶颈 不在模型够不够强,而在两件事没补齐:改哪里、会影响谁 的结构化上下文,以及 何时算做完、凭什么合并 的验收闭环。

16510

MiniMax M3:1M 上下文、SWE-Bench 59%,三项前沿能力一次集齐

运维有术

翻了一圈官方博客和技术报告,有一组数据让我有点意外:SWE-Bench Pro 评测 59.0%,超过 GPT-5.5 和 Gemini 3.1 Pro;1M ...

42000

AI 编程可闭环协作 · 卷五:存量项目怎么落地——案例、误区与渐进路线

小小猪排画中游

卷一~四讲的是 框架:意图 成果 验收、技术图谱、任务单与签收、专题收尾(一轮交付合并后的归档,卷四 §17)。若你的仓库已经跑了很多年,常见状态是:文档与...

12110

如何构建可落地的 LLM 测试评估体系

AI智享空间

LLM Judge 本身会漂移,会对格式有偏好,会受评估 prompt 措辞影响。把它当成唯一标准,最终结果就是“用模型的偏好来评估模型”,循环自洽。解决方式:...

15810

知识学习 | 2026 年 LLM 评测体系 & 主流开源模型启示

用户1589488

DeepSeek V4 是 2026 年开源界的标杆,其核心在于通过创新架构提升效率。

18610

ASR + OCR + LLM 三重校对:如何做到 95%+ 中英字幕准确率

gavin1024

A:可以,但 LLM 仲裁会引入 1~2 秒延迟。直播场景通常采用"ASR 快出 + LLM 事后合并"的双链路。

11810

31%:LLM 修 Bug 的真正天花板?

山野大叔

我们耗时多轮迭代,持续优化 LLM 自动修 Bug 流水线,从数据喂入、评分机制、Bug 分类到任务调度,完成了全链路架构优化。所有前置工程问题悉数解决,流水线...

9210

LLM驱动的自动化渗透测试:基于13个框架与15亿Token的实证效能评估

IT资讯研究所

腾讯科技 | 研究员 (已认证)

数据来源: 四川大学DAS-Lab、清华大学NISL-VUL337、彭佳仁(腾讯安全沙龙第8期分享人)及腾讯云安全团队联合发布的《Hackers or Hall...

13910
领券