当用户开始习惯向 AI 直接提问来获取品牌建议时,企业产生了一个新的技术需求:如何系统性地监测品牌在 AI 回答中的可见度与推荐状态。本文将剥离业务外壳,聚焦于背后的工程架构。我们将探讨如何利用云函数、消息队列、对象存储和关系数据库,设计一套低成本、可扩展的任务调度与数据分析系统,用于处理非确定性的生成式 AI 回答采集与指标计算。
传统的网页监测主要基于爬虫抓取静态 DOM 结构。但在 AI 时代,数据源变成了大模型的非确定性输出。同一个问题,间隔 10 秒问两次可能得到完全不同的推荐列表。
这给工程带来了三个核心难题:
我们选择腾讯云 Serverless 方案来应对这类流量波动大、执行时间长的场景。总体架构采用事件驱动模型,底层由三个组件闭环构成:任务工厂、弹性消费者、数据分层存储。
架构分层说明:
task_id、platform、query 的消息。简单的关键词轮询无法反映品牌在 AI 回答中的真实可见度。我们需要基于“用户意图分层”来构建问题库。问题库表结构设计如下:
-- 任务问题库基础表
CREATE TABLE question_library (
id BIGINT AUTO_INCREMENT PRIMARY KEY,
intent_type VARCHAR(30) NOT NULL COMMENT '意图分类: 推荐决策/对比分析/风险判断',
query_text TEXT NOT NULL COMMENT '提问原文',
target_keywords VARCHAR(255) COMMENT '监测的提取关键词',
status TINYINT DEFAULT 1 COMMENT '启用状态',
created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;调度器通过组合 问题 × 目标AI平台 × 采样轮次 三要素,生成待执行任务队列。这种设计能让系统轻易支持“同一问题对某平台进行 5 轮重复采样”的需求,从而观察 AI 回答的稳定性。
不同 AI 平台的 API 鉴权方式、请求体结构以及是否支持流式输出均有差异。工程上建议采用“适配器模式”,为每个平台封装独立的采集逻辑。
在执行过程中,需特别注意 Serverless 超时控制:
invalid 标签,避免污染有效样本库。一次完整的采集流水线会产生两种核心数据:全量原始数据与高价值结构化指标。
第一步:将 AI 返回的原始 Markdown/JSON 全文直接存入 COS,作为不可篡改的“证据留档”。
第二步:通过 NLU(自然语言理解)提取特征,写入分析型数据库。结果表的核心字段设计如下:
-- 测评采样结果表
CREATE TABLE monitoring_results (
id BIGINT AUTO_INCREMENT PRIMARY KEY,
task_id VARCHAR(64) NOT NULL,
platform VARCHAR(30) NOT NULL COMMENT 'AI平台',
intent_type VARCHAR(30) NOT NULL,
-- 提取指标
is_mentioned TINYINT(1) DEFAULT 0 COMMENT '是否提及',
is_recommended TINYINT(1) DEFAULT 0 COMMENT '是否推荐',
recommendation_rank INT DEFAULT 0 COMMENT '推荐位次',
has_citation TINYINT(1) DEFAULT 0 COMMENT '是否引用来源',
raw_data_url VARCHAR(512) COMMENT 'COS原始文件链接',
sampled_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
INDEX idx_brand (target_object, platform),
INDEX idx_date (sampled_at)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;当数据库沉淀了足量的多轮、多平台样本后,指标计算转化为标准的 SQL 聚合任务。
SUM(is_mentioned) / COUNT(CASE WHEN is_valid = 1 THEN 1 END) * 100%
注:此处需剔除因网络错误、平台限流导致的“无效样本”。rank=1)在所有正向推荐中的占比,从而得出品牌的推荐强度。构建一套 AI 回答监测系统,本质上是在利用云原生的高并发能力,去解构生成式 AI 的不确定性。通过消息队列与弹性计算分离任务调度,利用 COS 和 DB 进行分层存储,我们就能搭建起一个稳定、可复现的“品牌 AI 可见度”技术底座。
这种能力让企业的品牌部门不再仅凭“我感觉 AI 提了我们不少次”来做决策,而是拥有了连续、可对比的数据视角。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。