贝叶斯变平面回归 Bayesian change-plane regression

CreateAMind

发布于 2026-05-11 20:13:45

1250

文章被收录于专栏：CreateAMindCreateAMind

Bayesian change-plane regression

贝叶斯变平面回归

https://arxiv.org/pdf/2604.23851

摘要：

变平面回归通过一个可解释的线性阈值规则识别子群体，但针对硬阈值边界的基于似然的推断是非正则的：目标函数非光滑，在无异质性情形下边界呈弱识别，且标准大样本近似具有脆弱性。我们开发了一种新的贝叶斯推断框架，该框架基于一个probit门控工作似然——这是一个计算上正则的替代模型，且对于任意固定的平滑尺度而言均被有意误设。因此，在固定平滑尺度下，后验摘要应被解释为针对一个明确定义的平滑伪真实目标；仅当平滑尺度趋于零时，方能恢复针对硬阈值目标的推断，此时近似偏差由协变量分布的边界边际条件所控制。所得理论将误设情形下的Bernstein–von Mises论证适配于贝叶斯变平面回归，并明确揭示了将平滑尺度趋于零所引发的三角阵列权衡：更尖锐的门控会恶化高斯近似所需的导数界，而近似偏差则随边界附近协变量概率质量的局部大小而递减。基于所得的联合后验分布，我们进一步提出了一种基于决策论的报告规范，该规范将临床有意义异质性的证据与亚群边界的报告相分离，并通过后验成员概率将边界不确定性传播至协变量层面。模拟研究表明，与频率学派对应方法相比，我们的新方法在准确性与不确定性量化方面表现更优；在一项随机生活方式干预试验中的应用进一步证实了贝叶斯变平面回归在解析治疗效应异质性方面的实用价值。

关键词：变平面回归；贝叶斯推断；切片采样；亚群识别；后验收缩

1 引言

临床试验通常旨在检测完整研究人群中的平均治疗效应。然而，治疗反应在患者之间往往存在异质性；一种新疗法可能仅在特定亚群中有效，或比标准护理更有效。因此，临床试验中的监管决策越来越需要能够检测和量化异质性治疗效应的方法，同时保持对方案指定终点和亚群的可解释性和有效推断 [ICH E20, European Medicines Agency, 2025]。利用患者特异性协变量，亚组分析旨在识别具有增强治疗效应的患者，缩小疗法的目标人群，并指导未来的研究设计。传统的亚组分析通常一次测试一个变量，或者仅依赖简单参数模型中的交互项。这些策略往往效能不足，容易出现假阳性，并且忽略了多个个体属性可以共同塑造风险和反应这一事实 [Wang et al., 2007]。

变平面回归模型通过线性规则 1{Z⊤θ≥0} 定义亚组成员资格，并允许治疗效应在产生的两种机制中有所不同，从而应对了这一挑战。这产生了一个临床上可交流的决策规则——一个以零为截止值的单一得分

以及对治疗效应异质性的简约总结。尽管具有直观的吸引力，但针对硬阈值边界参数的推断本质上是非正则的。似然函数及相关的优化目标在 θθ 中是非光滑的，以至于在无异质性情况下识别会失效，且标准的大样本近似可能会失败或难以校准 [Fan et al., 2017, Kang et al., 2017, Wei and Kosorok, 2018]。这些挑战在有限样本中因多峰性以及对调优和初始化的敏感性而进一步加剧 [Lee et al., 2021]。

解决这些估计挑战的一种常见变通方法是用平滑对应物替换硬指示函数，以恢复可微性并促进优化 [Li et al., 2021, Zhang et al., 2022, Ge et al., 2023, Wei et al., 2023, Mukherjee et al., 2023]。虽然平滑提高了数值稳定性，但它也改变了推断目标：对于任何固定的平滑水平，所得模型通常不能与原始的硬阈值数据生成机制完美重合，且相关的估计可能在很大程度上依赖于调优选择（带宽、温度或惩罚项）。此外，在选择边界后的不确定性量化非常棘手：将估计边界视为固定的两阶段程序可能会低估估计亚群效应中的不确定性，特别是在边界被弱识别的零假设附近。

在本文中，我们为变平面回归贡献了一个全贝叶斯框架，我们的新颖贡献是多方面的。首先，我们定义了贝叶斯变平面回归模型本身。核心推断对象是一个正则化的、平滑索引的变平面规则的联合后验。在任何固定的平滑尺度下，该后验靶向 probit 门控工作模型的 Kullback-Leibler 伪真参数，而不是不连续的硬阈值参数本身；硬阈值目标是通过平滑消失机制来逼近的。这种区分对于解释很重要：平滑不被视为字面上的数据生成假设或自动选择的 nuisance 参数，而是作为一个将被报告的透明正则化水平。为了实现后验推断，我们开发了一种采样算法，该算法结合了产生条件高斯块的潜变量增强（在 Gibbs 采样器内）以及针对边界方向的免调优大圆椭圆切片更新。其次，我们建立了误设 probit 门控后验的大样本理论。据我们所知，这是贝叶斯变平面回归后验推断的首个渐近处理。固定平滑结果刻意建立在标准的误设后验理论之上，特别是 Kleijn 和 van der Vaart [2012] 的 Bernstein–von Mises 框架；变平面特有的贡献在于识别当使用平滑代理来近似非正则硬阈值时必须添加的内容。在平滑消失机制下，似然形成一个三角阵列：随着平滑减少，probit 门的导数变得越来越大，而伪真参数以由局部边界几何确定的速率漂向硬阈值目标。所得的边际分析产生了一个由普通参数波动加上依赖几何的平滑偏差组成的后验收缩率，并给出了多项式平滑计划的显式可行性计算。在用于高斯近似的充分导数包络条件下，该计算表明移除确定性中心偏移需要高边际几何。该理论阐明了何时硬阈值解释在渐近上是合理的，以及何时有限样本后验摘要应被解读为针对平滑目标的推断。第三，在贝叶斯变平面回归框架下，我们形式化了一个用于在弱识别下获得可解释亚组结果的基于决策论的报告协议。仅当后验为预定义的临床有意义异质性事件分配足够高的概率时，才报告亚组边界，边界不确定性通过后验硬成员概率传播到协变量水平。异质性证据、效应量可信区间摘要和亚组成员资格不确定性均源自同一联合后验，为频率学派工作流中所需的分离且不同校准的程序提供了一致的替代方案。最后，我们通过广泛的模拟研究评估了所提出的贝叶斯变平面回归，涵盖了正确指定和误设的基线以及低维和高维效应修饰因子设置，展示了相对于频率学派对应方法在治疗效应对比和边界方向上的有利准确性和不确定性量化。我们进一步通过对 PREMIER 临床试验的应用说明了该框架。

2 变平面回归的贝叶斯推断

假设我们要观察独立同分布（i.i.d.）数据