成功的企业AI部署需要从PB级的非结构化专有公司数据中检索上下文。这些RAG管道的核心是向量搜索。然而,随着数据量增长,构建这些向量索引往往成为瓶颈,阻碍部署并推高开销成本。
通过与NVIDIA cuVS集成实现GPU加速索引,Elastic将建索引过程中的计算密集型工作卸载。其结果是显著的:
作为NVIDIA企业AI工厂验证设计推荐的向量数据库,Elastic驱动自主代理引擎,能够以最相关的数据有效进行推理和行动。加速索引意味着代理可以基于实时公司数据在规模上做出决策。
某中心AI平台为企业提供了Kubernetes原生基础,以便从模型训练的数据检索管道到推理实现AI工作负载的运维化。Elastic与NVIDIA加速技术结合某中心AI栈,为优先考虑主权AI的客户弥补了关键缺口。
通过使用Elastic代理构建器和Elastic工作流,开发人员现在可以在基于某中心OpenShift AI的环境中构建自主代理。这些代理将检索信息并在混合云中触发运维工作流,同时将数据和模型保留在自身环境内。
某中心生态系统开发高级总监表示:“某中心OpenShift为企业提供了必不可少的Kubernetes原生基础,使其能够在任何混合云环境中运维化和扩展AI工作负载。通过在OpenShift和某中心AI平台上启用Elastic的GPU加速搜索,我们共同交付了一个生产就绪的开放平台,使客户能够构建安全、高性能的RAG和自主AI代理,同时保持对其数据主权的完全控制。”
某中心与Elastic及NVIDIA的合作,使受严格数据主权法规约束的机构能够灵活管理其数据,无论数据位于何处。
客户可以无缝部署自主AI系统并运维化代理运维实践。某中心AI平台上的Elastic确保专有业务数据和模型部署在所选环境中:自有数据中心、云区域或混合架构。
考虑一个金融机构面临部署面向客户的AI助手的监管复杂性和基础设施成本。为了有效工作,该AI助手必须作为一个代理运行,能够实时检查客户账户信息并标记可疑活动。
通过在某中心AI平台上使用Elastic GPU加速搜索,该金融机构现在可以:
支持GPU加速的Elasticsearch现已可在某中心AI平台上使用。无论是构建初始RAG应用,还是全球规模部署AI工厂,Elastic、某中心与NVIDIA的组合都能为基于开源基础的现代AI解决方案提供所需的性能和灵活性。FINISHED
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。