首页
学习
活动
专区
圈层
工具
发布

#索引

我为什么想继续探索 ace-tool 这个方向

不换

这篇文章记录了作者为什么会持续关注 ace-tool 这个方向,并把它当成理解 Agent 代码上下文的一次学习与探索。 核心观点是:AI Coding 当前更...

100

数据量大查询慢?索引让你的SQL秒级响应!|转行学DB第9天

数据库小学妹

前几篇我们学会了各种查询技巧:单表查、多表连、分组统计、子查询嵌套。但随着查询的数据越来越多,我就发现:

1400

使用 Elasticsearch 和 Jina Embeddings 进行无监督文档聚类

点火三周

从向量搜索到强大的 REST API,Elasticsearch 为开发人员提供了最全面的搜索工具包。您可以在 Elasticsearch Labs 仓库中的示...

400

使用 Elasticsearch 和 Jina 嵌入的无监督文档聚类

点火三周

从向量搜索到强大的 REST API,Elasticsearch 为开发者提供了最全面的搜索工具包。您可以在 Elasticsearch Labs 仓库中查看我...

1000

一文搞懂Hermes:新顶流Agent如何从经验中自我进化

腾讯云开发者

当前的 Skill 匹配完全依赖 Agent 自己阅读索引后判断。如果 Skill 的名称和描述不够精准,或者用户的任务描述与 Skill 的触发条件有语义差距...

2600

IDEA官宣:终于可以爽用Junie CLI了!

GoLang学习记

JetBrains 最新搞了个大动作:Junie CLI 现在能自动检测并连接你正在运行的 JetBrains IDE,直接复用你配置好的代码索引、语义分析。一...

1800

刚刚!VS Code 官宣:终于可以玩视频了!

GoLang学习记

现在统一成一种状态:你的代码库要么已语义索引,要么没有。背后细节微软帮你管,用户不用操心。

1300

向量相似性搜索详解:Flat Index、IVF 与 HNSW

deephub

向量相似性搜索算法有多种,本文介绍以下四种:余弦相似度搜索、Flat Index、倒排文件索引(IVF)、HNSW(层次化可导航小世界)。

3700

京东大模型二面:你知道哪些方法可以提高RAG的检索正确率?

lyb-geek

RAG 系统里最容易被低估的环节,恰恰是检索。很多人把精力花在 Prompt 调优或者换更强的生成模型上,结果发现效果依然不理想——问题根本不在生成端,而是检索...

5010

RAG 的检索模块是怎么优化的?

lyb-geek

RAG(Retrieval-Augmented Generation)中的检索模块是整个系统的关键环节,直接影响生成结果的质量。为了提升检索的准确性、相关性和效...

2810

从零理解 RAG:LlamaIndex 入门指南

烟雨平生

LlamaIndex 的设计哲学是「数据优先」:一切从你的文档出发,帮你把数据变成可查询的索引,再把索引变成可交互的应用。

4810

从零搭建个人Wiki RAG:Karpathy范式的本地知识库

烟雨平生

核心区别:不需要向量数据库,不需要Embedding,不需要检索管线。 LLM读一个index.md全局索引,然后按需拉取具体的Wiki文章。

17310

10分钟带你从零搭建本地RAG:向量 + BM25 + RRF 混合检索,一篇就够+github完整源码

烟雨平生

首次运行会同时构建 FAISS 索引和 BM25 索引(大约 10–30 秒),之后每次直接加载。正常运行输出:

8910

向量数据库原理及在场景理解的应用

索旭东

索引是向量数据库的“发动机”。它通过特定的数据结构,将海量向量组织起来,使得搜索时无需遍历整个数据集。主流的索引算法包括:

3710

大白话理解向量数据库

索旭东

向量数据库与传统数据库最本质的区别在于索引结构。因为暴力计算所有向量对的距离在百万级以上数据量时完全不可行,因此必须建立专门的近似最近邻(ANN,Approxi...

4710

RAG详解:让大模型看见你的私有知识

用户9574405

在把大语言模型用到实际业务时,开发者很快会遇到一个问题:通用模型很难满足特定场景的需求。

4610

RocketMQ 两大核心特性深度拆解:事务消息与延时消息,从原理到实战全打通

果酱带你啃java

在分布式微服务架构中,消息中间件是解耦系统、削峰填谷、异步通信的核心组件。RocketMQ作为阿里开源的金融级分布式消息中间件,凭借高可靠、高吞吐、低延迟的特性...

4610

Elasticsearch 核心命脉:倒排索引、分片机制与全链路高性能调优实战

果酱带你啃java

检索的本质是从海量数据中快速找到符合条件的目标内容,而索引的设计直接决定了检索的效率。要理解倒排索引,首先要明确正排索引与倒排索引的本质区别。

4010

分库分表下的分页查询:底层逻辑、全场景坑点与生产级最优解

果酱带你啃java

在分布式系统架构中,分库分表是解决MySQL单表千万级以上数据量性能瓶颈的核心方案。但绝大多数开发者在落地分库分表后,都会遇到分页查询的致命问题:要么分页结果数...

3210

ELK 搭建实战:从 0 到 1 打通日志收集、分析与可视化

果酱带你啃java

在分布式系统、微服务架构成为主流的今天,日志已经不再是简单的“程序运行记录”,而是定位问题、监控系统、分析用户行为的核心数据资产。但面对成百上千台服务器的日志散...

7310
领券