润乾报表 NLQ 组件正是基于这一洞察,绕开了大模型的技术路线,通过一套精密的“规则词典”,同样实现了高效、可靠的自然语言查询。 业务语义词典:这是让 NLQ“懂业务”的关键。维词:定义了像年、月、省份、产品类别这样的分析维度。NLQ 知道“月”是从日期字段里提取出来的一个层次。指标:定义了像销售额、月活数这样的业务指标。 一个具体的查询过程当用户输入“去年北京发往青岛的订单”时,NLQ 会启动一套精密的解析流程:词汇切分与过滤:NLQ 首先将句子拆解为“去年”、“北京”、“发往”、“青岛”、“订单”等关键令牌,并过滤掉“ “双打”或许是最佳组合既然 LLM 长于“灵活理解”,NLQ 善于“精准执行”,那么为何不让它们组队呢? 经过确认后,再由 NLQ 这个“可靠后台”精准执行,最终得到一个既符合用户意图、又准确的结果。这样,既享受了 LLM 的交互友好性,又保证了 NLQ 的查询准确性和低成本,可谓鱼与熊掌兼得。
通过优先考虑元数据质量和针对性的模型微调来解锁可扩展的 NLQ 到 SQL,以提高准确性和成本效益。 一个 NLQ 的例子是“按销售收入排列前五名的子品牌是什么?” 挑战 3:NLQ 到 SQL 中出现幻觉 大型语言模型(GenAI)在问答中出现幻觉是一个众所周知并被广泛研究的现象。 然而,LLM在根据自然语言查询(NLQ)生成SQL查询时产生的幻觉却是一个鲜为人知的课题。 本文总结了在实现生产级企业级NLQ到SQL系统中的五大挑战。使用这些系统可以持续地达到超过90%的准确率。
别急, NLQ 带来了一条不同的路——一条让中小企业、普通开发团队都能轻松上车、用得安心、花得明白的路。 NLQ 的核心,就是把这套业务逻辑,预先编制成一套机器能严格执行的“业务词典”和“查询规则”。 当然,NLQ 也可以和 LLM 配合使用。 对于那些非常口语化的表达,一个绝佳的搭配是:用大模型(LLM)作为“前端翻译”,把随意的口语转换成 NLQ 能听懂的规范问题,再由 NLQ 这位“老会计”精准执行。 NLQ+LLM= 灵活 + 可靠。如何上手:比你想象得更简单最直接的方式, NLQ 已经作为智能模块,内置在润乾报表产品中。这意味着,使用或集成润乾报表,你就自然获得了这项“智能问数”的能力。
那么,架构中的 NLQ 规则引擎,是如何能像“理解了一门语言”一样,将仍有相当自由程度的规范文本准确地转换为语法严格的 MQL?就像前篇所言,这个 NLQ 已经相当于实现了一个小语言模型(SLM)。 这就是本篇将要解析的NLQ 词典,它是 NLQ 引擎的“大脑”与“规则手册”,支撑整个架构实现准确性。 NLQ 词典:语义的映射基础NLQ 词典是一个结构化的业务 - 数据映射知识库,定义了业务语言中每个“词”在数据世界中身份、行为逻辑和关联关系。 这个过程由懂业务的开发人员实施,技术门槛远低于 AI 模型的训练与调优,确保了 NLQ 方案的普适性和可落地性。 至此,润乾 NLQ 技术解析系列三部曲已完结。我们从“规范文本”破局,用“MQL”实现复杂性,继而用“NLQ 词典”保证准确性。
可信赖的结果,确保正确性NLQ 组件采用规则引擎技术,通过抽象汉语规律得到规则模型,可以实现精准的 AI 式数据查询,彻底杜绝大模型的幻觉问题。 NLQ 如果识别不了用户的输入,会提示无法查询,请用户换一种说法再尝试。而不会像大模型那样总是给个不知对错的答案。 NLQ 组件给出结果后,会以用户看得懂的形式对这个语句进行解释,如果有多种解释也会让用户选择,比如日期可以是发货日期或者收货日期:BI 领域知识的完美容器NLQ 组件预先用领域知识建立词典,导入数据结构 支持有复杂指标的高级分析NLQ 组件内置的查询语言 MQL 包括 DQL 和 SPL。 搭配大模型,润乾报表 NLQ 使 ChatBI 不仅好玩而且管用规则引擎对自然语言的规范性有一定要求,不能使用太随意的词句。
基于规范文本的 NLQ 架构成功解决了 Text2SQL 的困境,实现了灵活性、准确性和复杂性三者兼得。 NLQ 词典与准确性 NLQ 引擎是另一个关键的技术挑战。它要具备一定程度的语言解析能力,能够准确理解规范文本中多样的表达方式。 这里将先聚焦于解决汉语环境下的 NLQ 解析问题。 NLQ 词典:语义的映射基础 NLQ 规则引擎如何能像“理解了一门语言”一样,将仍有相当自由程度的规范文本准确地转换为语法严格的 MQL? 这就是NLQ 词典的任务。 NLQ 词典是一个结构化的业务 - 数据映射知识库,定义了业务语言中每个“词”在数据世界中身份、行为逻辑和关联关系。 结语 润乾 NLQ 技术已解析完毕。我们从“规范文本”破局,用“MQL”实现复杂性,继而用“NLQ 词典”保证准确性。
润乾 NLQ 正是这条技术路径的实践者。 润乾 NLQ 的解析能力足以覆盖绝大多数数据分析需求。明细查询:想要什么数据,直接列出来从最基础的字段查看到智能的跨表组合,NLQ 都能精准应对。 通过这些例子可以看到,基于规则的润乾 NLQ 引擎并非只能处理简单查询。 正因清晰地认识到上述边界,润乾 NLQ 与 LLM 的协作才显得尤为恰当与务实。 可以引入 LLM 作为“智能前端翻译”,将用户灵活多变、不甚规范的自然语言提问,转换为符合 NLQ 词典与语法规范的查询语句,再由 NLQ 引擎进行精准的数据查询。
破局之路:基于“规范文本”的 NLQ 架构针对上述困境,润乾 NLQ 提出了一种新的三阶段架构,其核心在于通过可确认的 "规范文本" 这一设计,重构了人机协作的查询生成流程。 实施的核心工作转变为构建 NLQ 业务词典,这一任务的技术门槛远低于模型训练,普通开发人员即可胜任。任务简化还带来了明显的成本优势。 NLQ 引擎基于规则实现,涉及的词汇在数千到数万量级,不需要多大算力,用普通 CPU 即可实现高并发处理,整体成本很低。 基于规范文本的 NLQ 架构成功解决了 Text2SQL 的核心困境,实现了灵活性、准确性和复杂性三者兼得。 NLQ 引擎的开发挑战另一个关键技术挑战在于 NLQ 引擎。该引擎需要具备一定程度的语言解析能力,能够准确理解规范文本中多样的表达方式。
润乾 NLQ走的正是这条白盒路线。它的中间层叫做规范文本,是一种介于口语和 SQL 之间的结构化表达。 这样润乾 NLQ 就能放出公开 DEMO 了(http://query.raqsoft.com.cn:6999/nlq.html):它可能有查不出来而拒绝的问句,但只要用户确认了规范文本,返回结果就是对的 这里有个用 NLQ 做的 A 股查询界面 https://q.aiqt.cc,没有接入 LLM,可以感受一下。如果接 LLM:润乾 NLQ 允许接入任意大模型,把口语问题先转成规范文本,再走规则引擎。 即使如此,仍然会有一些查询是 NLQ 的规范文本描述不了的。比如“按订单金额从高到低排序”。NLQ 的处理方案是在查询结果界面上点击列标题就能排序,可以支持多字段、升降序。 对于这种情况,润乾 NLQ 的解决方案不是硬撑,而是承认边界,补上 NLR(自然语言报表)。比如要计算每个月的销售额增长率,可以先用 NLQ 查出结果集。
深入解析从NLQ到AIAgent的进化,揭示对话式分析的正确方向随着企业数据量的爆炸式增长,如何高效、便捷地从数据中提取价值,已成为决定企业成败的关键。 正确的进化方向:从NLQ到AIAgent既然单纯的Text-to-SQL是歧途,那么正确的道路在何方? 答案是向更高级的智能形态进化:从基础的自然语言查询(NLQ),经由对话式分析,最终到达具备自主决策能力的AIAgent。 第一阶段:自然语言查询(NLQ)与语义层NLQ是起点,它通过NLP技术将自然语言映射到数据库查询。但要使其可靠,关键在于引入一个“中间层”来弥合语义鸿沟。 果断转型,拥抱未来:放弃较为初级的NLQ功能,证明了单纯的Text-to-SQL路线在实践中遇到了瓶颈。其转型方向验证了Agent模式的正确性。
润乾 NLQ 选择了一条不同的工程化路径。 要理解润乾 NLQ 的突破,需看清当前主流技术路径的局限。问题核心在于,无论是端到端生成还是引入中间表示,其本质都依赖于 LLM 的概率性生成与泛化能力。 免疫原理:润乾 NLQ 的确定性编译架构上面那个噩梦级的 SQL,其实是润乾 NLQ 从“各省的员工数量、产品数量和订单数量”这句话生成的(因为程序生成,里面的中间表名明显是没有业务意义的),Text2SQL 更多实例基于维度对齐和确定性编译的思想,润乾 NLQ 能够系统性地化解各类让 Text2SQL 方案棘手的 JOIN 难题。 润乾 NLQ 这套方案,说直白点,就是稳、省、简单、好接入。不靠 AI 去“猜”复杂的多表关联该怎么连,而是用一套可靠的规则引擎来“算”,所以结果非常准,不会出现时灵时不灵的情况。
在基于 "规范文本" 的 NLQ 架构中,MQL(Metrics Query Language)作为规范文本的确定性编译目标,承担着关键使命。 我们通过具体实例说明这一机制:比如用户输入“请帮我查一下北京发往青岛的订单”,首先会由 LLM 转换成标准文本“北京 发往 青岛 订单”,接下来 NLQ 引擎解析后生成 MQL:SELECT 发货城市 到这里润乾 NLQ 架构的各个组件均已呈现:LLM 保障灵活性:处理自然语言的多样性规范文本确保准确性:通过可确认的中间层解决语义幻觉MQL 提供规范性:建立精确的查询语义基准DQL 处理数据关联:通过维度建模简化复杂的数据关系 润乾 NLQ 通过 MQL、DQL、SPL 的协同设计,构建了一个层次清晰、职责分明的 Text2SQL 架构。 在接下来的文章中,我们将继续深入探讨基于词典的 NLQ 引擎如何将规范文档准确地编译成 MQL。
国内代表:瓴羊Quick BI:集成通义大模型,支持中文自然语言查询(NLQ)与自动化归因分析,主攻电商与SaaS领域。 /月Power BI微软生态协同自然语言查询、AI Copilot、Office无缝集成中小企业、微软生态用户10–40 美元/用户/月瓴羊Quick BI云上智能分析通义大模型集成、自动化归因、中文NLQ
它基于已在 Text2SQL 场景中得到验证的润乾 NLQ 规则引擎( 万字长文解析 Text2SQL 破局,兼得灵活复杂准确 ),将“自然语言转精准操作”的能力,从数据查询无缝延伸至后续的多维分析阶段 先从 NLQ(自然语言查询)开始,得到查询结果:接下来针对这个结果做进一步分析,点击“新建报表”,进入多维分析界面:下面我们通过汉语命令来指挥数据分析工作。 润乾 BI 的这套自然语言交互能力,延续了与 NLQ 一脉相承的规则引擎技术路线(而非依赖 LLM)。这带来了一个显著特点:极高的准确性与可靠性,从根本上杜绝了“幻觉”。
从早期复杂报表到自助式BI,再到自然语言查询(NLQ)与ChatBI,人机交互方式持续进化。2025年,AI Agent成为推动BI从“问答模式”转向“自主探索与行动模式”。 3.2 分阶段实施策略阶段一:基础建设与试点(3-6个月)选择1-2个数据规范的场景(如销售业绩查询)试点;构建初始语义层(20-30个核心指标);配置知识库(同义词、业务术语);评估NLQ
从简单的自然语言查询(NLQ)到具备多轮对话和自主分析能力的AI智能体(Agent),其功能深度和交互模式各有千秋。 ThoughtSpot优势:AI原生架构,技术理念领先;Agentic分析能力提供了更深度的智能体验;专注于NLQ和搜索,体验打磨精细。 五、市场趋势与未来展望通过对以上产品的分析,我们可以看到ChatBI领域的几个明显趋势:从问答到代理(FromQ&AtoAgent):简单的自然语言查询(NLQ)已成为基础能力,未来竞争的焦点将是能够理解复杂意图
exceptExceptionase:return{"success":False,"error":str(e),"sql":sql}return{"success":False,"error":"无法生成SQL"}#使用示例nlq =NaturalLanguageQuery("xiaozhongqingdan.db")result=nlq.query("过去七天新增了多少清单?")
微软生态协同 自然语言查询、AI Copilot、与Office无缝集成 120-480美元/用户 中小企业标准化分析、微软生态用户 瓴羊Quick BI 智能商业分析 通义大模型集成、自动化归因分析、中文NLQ
新版本革命性升级NLQ自然语言查询能力,业务人员通过口语化指令即可完成80%分析任务。 功能特点生态无缝协同:Excel公式一键转DAX模型,Teams频道实时推送预警低代码开发:NLQ自然语言查询,业务人员独立完成80%分析任务个人版免费:企业版订阅价10-40美元/月/用户产品优势全球用户超
阶段3:生成式AI增强规则管理用NLQ(自然语言查询)生成初始决策表(比如“请创建一个根据订单金额和客户等级自动打折的规则”);AI检查规则冲突(比如促销策略和风控规则有矛盾)。