首页
学习
活动
专区
圈层
工具
发布

#优化

分布鲁棒PAC-贝叶斯控制

CreateAMind

Distributionally Robust PAC-Bayesian Control

500

曲率感知期望自由能:贝叶斯优化采集函数

CreateAMind

Curvature-aware Expected Free Energy as an Acquisition Function for Bayesian Opt...

600

第10课:Agent 体系,认识你的 AI 团队成员

前端达人

实际上,Claude Code 里不只有"一个 Claude"。它有一套完整的 Agent 体系——8种专门角色,每种针对特定任务优化。你可以同时调动多个 Ag...

300

多大才算太大?Elasticsearch的尺寸优化最佳实践

点火三周

在Elasticsearch中没有硬性的大小限制。生产集群可以达到PB级别。然而,“太大”通常会从三个方面表现出来:查询速度超过您的服务水平协议(SLA)、节点...

700

如何用 AI 实现测试用例去重与优化?

AI智享空间

每一个经历过大型项目迭代的测试团队,几乎都踩过同一个坑:测试用例库越积越大,执行时间越来越长,覆盖率报告看起来漂亮,但真正拦截问题的用例却寥寥无几。

2400

129:多云/混合云部署策略:灵活部署方案

安全风信子

摘要: 本文深入探讨多云/混合云部署策略,通过详细案例展示如何实现灵活的部署方案。我们将分析多云架构、混合云设计、成本优化以及最佳实践,为AI工程师提供一套完整...

5100

京东大模型二面:你知道哪些方法可以提高RAG的检索正确率?

lyb-geek

RAG 系统里最容易被低估的环节,恰恰是检索。很多人把精力花在 Prompt 调优或者换更强的生成模型上,结果发现效果依然不理想——问题根本不在生成端,而是检索...

4910

RAG 的检索模块是怎么优化的?

lyb-geek

RAG(Retrieval-Augmented Generation)中的检索模块是整个系统的关键环节,直接影响生成结果的质量。为了提升检索的准确性、相关性和效...

2110

2026 RAG 全景:从大模型基座到 Agent 记忆中枢——万字长文吃透全栈落地

烟雨平生

这篇论文里的 RAG 和我们今天用的有本质区别:它是端到端可训练的。检索器和生成器是一个整体,用联合训练的方式来优化。

12010

开源大模型在卷什么?原来都在干同一件事!?

烟雨平生

LLaMA、Qwen、Mistral、DeepSeek、Baichuan……名字一大堆,眼花缭乱。

2110

Transformer面试必看:归一化从原理到大厂实战落地方案(全演进梳理)

烟雨平生

3.2.1 分阶段优化:早期的BERT、原生Transformer用Post-LN,后来到PaLM(5400亿参数),直接全面切换到Pre-LN,还搭配了残差连...

3100

从现象到根因,一篇讲透Transformer视角下“复读机” 现象

烟雨平生

在日常使用大语言模型生成内容时,你是否遇到过这样的场景:输入一段提示词,模型却输出了大量无意义的重复文本,像一台失控的 “复读机”—— 词汇反复堆砌、语义断裂空...

1810

大语言模型训练范式入门课:LLM都是如何训练出来的?干货满满,一文讲清楚!

烟雨平生

PPO(Proximal Policy Optimization,近端策略优化) 和 DPO (Direct Preference Optimization,直...

3110

Transformer灵魂1问:如何理解Attention中的Q,K,V?你会了吗?一文讲清楚

烟雨平生

训练过程:WQ, Wk, Wv模型初始化时随机生成,作为模型参数。在训练中,通过反向传播和梯度下降算法,根据任务目标(如语言模型的下一个词预测)不断迭代优化,最...

3710

史上最全Transformer面试题系列(一):灵魂22问帮你彻底搞定Transformer-干货!

烟雨平生

主流组合优化策略:KV Cache + INT4/INT8 量化 + ONNX 转换 + TensorRT 优化,是 ChatGLM、LLaMA 等模型在消费级...

4200

DeferredResult真相:没有提高QPS,没有优化系统性能!那Spring为什么要发布这个功能?有示例源码

烟雨平生

同时DeferredResult有增加系统负载的风险,如何使用要提前做好评估。是不是感觉与Service层方法加@Async的效果相同?是的,都是在优化work...

2110

具备情绪感知的,智能语音对话系统方案

索旭东

生产级(8–12周): 阿里云+emotion2vec → 成本 ¥0.8–1.2/分钟

3710

日语客服对话系统的低延迟方案

索旭东

核心理念:用 DeepSeek V3 替代 GPT-4o-mini,成本降低 80%,延迟相当

3210

Transformer中残差连接和层归一化原理解析

索旭东

层归一化 是“让训练可以快”的秘诀,稳定了前向和反向传播的数值,使得优化器能够以更高的学习率大步前进,从而大大缩短训练时间。

3010

.NET MAUI自定义URL协议处理:StealthClaw用户体验优化,从白屏到优雅引导

桑榆肖物

今天,我将分享如何通过一系列用户体验优化,让StealthClaw从一个"技术Demo"蜕变为真正"用户友好"的工具。

1410
领券