ICLR 2026 change point detection dynamic multilayer networks D-MRDPG 图像分割 low-rank tensor estimation limiting distribution confidence interval

Change Point Localization and Inference in Dynamic Multilayer Networks¶

会议: ICLR 2026
OpenReview: https://openreview.net/forum?id=bwtiK0yjuK
代码: 待确认
领域: 统计学习 / 变点检测 / 动态网络
关键词: change point detection, dynamic multilayer networks, D-MRDPG, seeded binary segmentation, low-rank tensor estimation, limiting distribution, confidence interval

一句话总结¶

针对"共享节点隐位置、各层连接权重随时间突变"的动态多层随机点积图（D-MRDPG），本文提出"种子二分分割 + 低秩张量精修"的两阶段离线变点定位算法，首次给出变点个数与位置的一致性保证、精修估计量的极限分布，并配套数据驱动的置信区间构造。

研究背景与动机¶

领域现状：网络变点分析是统计学的成熟方向，已在不齐次 Bernoulli 网络、随机块模型（SBM）、单层随机点积图（RDPG）等模型上有离线/在线方法。但现实系统往往是多层网络——同一组节点之间存在多种类型的交互（如不同农产品的贸易、不同航司的航线），各层异质且共享底层节点属性。

现有痛点：多层动态网络的变点检测此前几乎是空白。最接近的 Wang et al. (2025) 只做了 D-MRDPG 的在线检测，其定位率为 \(\kappa^{-2}(d^2 m_{\max}+nd+Lm_{\max})\log(\Delta/\alpha)\) 量级；离线设定下既没有定位算法，更没有推断层面的结果（极限分布、置信区间）。而通用图变点方法（gSeg、kerSeg）把多层网络压成单一相似度图或 Frobenius 范数，丢掉了层结构与低秩信号，在密集小幅变化下灵敏度差。

核心矛盾：多层张量数据维度高（\(n\times n\times L\)）、噪声重，直接做 CUSUM 扫描既慢又不准；但若能利用"节点隐位置共享 + 各层权重矩阵低秩"的结构，理应得到比单层更锐利的定位率。如何把这套结构性先验落到算法与渐近理论上，是核心难点。

本文目标：在离线设定下，对 D-MRDPG 同时解决定位（估计变点个数 \(K\) 与位置 \(\eta_k\)）与推断（给出 \(\hat\eta_k\) 的极限分布与置信区间）。

核心 idea：用种子二分分割廉价地圈出候选变点（粗定位），再用张量异方差 PCA（TH-PCA）低秩估计在局部窗口内精修扫描统计量（细定位）；理论上证明精修后的估计量在跳变消失（vanishing jump）下收敛到一个双边布朗运动 + 漂移随机游走的 argmin，从而可模拟分位数构造置信区间。

方法详解¶

整体框架¶

模型设定为 D-MRDPG：每个时刻 \(t\) 观测一个 \(L\) 层邻接张量 \(A(t)\in\{0,1\}^{n\times n\times L}\)，各层连接概率由 \(P_{i,j,l}(t)=X_i^\top W^{(l)}(t)X_j\) 决定——节点隐位置 \(\{X_i\}\) 固定共享，只有层权重矩阵 \(\{W^{(l)}(t)\}\) 随时间变化；当且仅当 \(t\) 是变点时权重发生跳变。算法（Algorithm 1）分两阶段串联：Stage I 用种子区间上的 CUSUM 统计量做种子二分分割（SBS），快速产出一批粗候选；Stage II 在每个粗候选周围的局部窗口里，用 TH-PCA 把含噪的 CUSUM 张量投影到低秩子空间得到精修扫描统计量，取其极大值点作为最终变点。Stage III（推断）则在精修点上估计跳变方差并模拟极限分布得到置信区间。

flowchart LR
    A["D-MRDPG 邻接张量序列<br/>A(t)∈{0,1}^{n×n×L}"] --> B["Stage I 种子二分分割<br/>种子区间 + CUSUM 统计量<br/>超阈值 τ 取极大点"]
    B --> C["粗候选集 Ĉ = {b_k}"]
    C --> D["Stage II 局部精修<br/>局部窗口内 TH-PCA 低秩估计<br/>精修扫描统计量取 argmax"]
    D --> E["精修变点 {η̂_k}"]
    E --> F["Stage III 推断<br/>估计跳变 κ_k / 方差 σ²<br/>模拟双边布朗运动 argmin"]
    F --> G["数据驱动置信区间"]

关键设计¶

1. 种子二分分割 + CUSUM 粗定位：用对数级区间覆盖换掉随机抽样。 Stage I 沿用 Kovács et al. (2023) 的种子区间思想：在 \(J=\lceil C_J\log_2 T\rceil\) 个尺度上确定性地铺设一族区间 \(\mathcal{J}=\bigcup_j \mathcal{J}_j\)，每个尺度 \(j\) 把时间轴切成长度约 \(T2^{-j+1}\) 的重叠区间。对每个区间 \((s,e]\) 计算 CUSUM 张量 \(\widetilde{B}_{s,e}(t)=\sum_{u=s+1}^{e}\omega^t_{s,e}(u)B(u)\)，权重 \(\omega^t_{s,e}(u)=\sqrt{(e-t)/[(e-s)(t-s)]}\)（\(u\le t\)）与 \(-\sqrt{(t-s)/[(e-s)(e-t)]}\)（\(u>t\)），取区间内使内积统计量 \(\langle\widetilde{A}_{\alpha,\beta}(t),\widetilde{B}_{\alpha,\beta}(t)\rangle\) 最大、且超过阈值 \(\tau\) 的点作为候选，并递归切分。相比 wild binary segmentation 的随机抽区间，种子区间是确定性、可复现、且只需 \(O(\log T)\) 个尺度，整阶段成本 \(O(Tn^2L\log_2 T)\)。这里用两条独立分裂序列 \(A,B\) 算 CUSUM 与扫描内积，是为了消除自身相关、便于理论分析（实践中用奇偶分裂复用同一数据）。

2. TH-PCA 低秩张量精修：把噪声压回信号子空间换取更锐利的定位率。 Stage II 的关键在于：期望 CUSUM 张量 \(\widetilde{P}_{s,e}(t)=\mathcal{S}\times_1 X\times_2 X\times_3 \widetilde{Q}_{s,e}(t)\) 具有 Tucker 低秩结构（mode-1、2 受 \(X\) 约束秩 \(\le d\)，mode-3 由权重矩阵堆叠 \(Q(u)\) 的秩 \(m\) 控制）。于是在每个粗候选 \(b_k\) 的局部窗口 \((s_k,e_k]\) 内，用张量异方差 PCA（TH-PCA，Han et al. 2022）把含噪 CUSUM 张量投影到 \((d,d,m)\) 维低秩子空间得到 \(\widehat{P}_{s_k,e_k}(b_k)\)，再定义精修扫描统计量 \(\widehat{D}^{s_k,e_k}_{b_k}(t)=\langle \widehat{P}_{s_k,e_k}(b_k)/\|\cdot\|_F,\ \widetilde{A}'_{s_k,e_k}(t)\rangle\)，取其极大点为 \(\hat\eta_k\)。TH-PCA 额外加了截断步，把方差大的方向压低。低秩投影把全张量噪声 \(O(n^2L)\) 量级压到有效自由度 \(O(nL^{1/2}+d^2m+nd+Lm)\) 量级，正是这一步让定位误差从 Theorem 1 的 \(\epsilon_k=C_\epsilon\log(T)/\kappa_k^2\) 进一步收紧到 Theorem 2 的 \(O_p(\kappa_k^{-2})\)（去掉对数因子），且不因多层而损失精度。

3. 双跳变区间下的极限分布与置信区间：把变点估计写成随机游走 argmin。 推断的核心结果 Theorem 2：在跳变消失（\(\kappa_k\to 0\)）时，精修估计量满足 \(\kappa_k^2(\hat\eta_k-\eta_k)\xrightarrow{D}\arg\min_{r}P_k(r)\)，其中漂移-噪声过程

\[ P_k(r)=\begin{cases} r+2\sigma_{k,k}\,\mathbb{B}_1(r), & r<0,\\ 0, & r=0,\\ r+2\sigma_{k,k+1}\,\mathbb{B}_2(r), & r>0,\end{cases} \]

\(\mathbb{B}_1,\mathbb{B}_2\) 是两条独立标准布朗运动，变点两侧用不同方差 \(\sigma_{k,k}^2,\sigma_{k,k+1}^2\)（因为变点前后分布不同，跳变在两侧的噪声非对称），这是相对单边设定更细致的"双边布朗运动"刻画。这是网络数据变点估计量极限分布的首个结果。据此构造置信区间：先估跳变 \(\hat\kappa_k\)、归一化跳变张量 \(\hat\Psi_k\) 与两侧方差 \(\hat\sigma^2\)，再用高斯随机游走 \(\widehat{P}_k(r)\) 模拟 \(B\) 次取 argmin 得到经验分位数 \(q_{\alpha/2},q_{1-\alpha/2}\)，最终 \((1-\alpha)\) 置信区间为 \(\big(\hat\eta_k-\lfloor q_{1-\alpha/2}/\hat\kappa_k^2\rfloor,\ \hat\eta_k-\lceil q_{\alpha/2}/\hat\kappa_k^2\rceil\big)\)。整个流程数据驱动、无需重抽样。

实验关键数据¶

主实验（模拟，四种场景）¶

CPDmrdpg 对比 gSeg（Chen & Zhang 2015）与 kerSeg（Song & Chen 2024），后者各有 networks 与 Frobenius 范数两种输入。指标：变点个数误差 \(|\widehat{K}-K|\)、双向 Hausdorff 距离 \(d(\widehat{C}\,|C)\) 与 \(d(C\,|\widehat{C})\)、时间段覆盖率 \(\mathcal{C}\)（越高越好）。Scenario 1/4 服从 Model 1，2/3 故意违反以测稳健性。

方法	\(\lvert\widehat{K}-K\rvert\) (\(n{=}50\))	\(\mathcal{C}\) (\(n{=}50\))	\(\lvert\widehat{K}-K\rvert\) (\(n{=}100\))	\(\mathcal{C}\) (\(n{=}100\))
CPDmrdpg	0.01	99.86%	0.00	100%
gSeg (nets.)	1.09	52.82%	1.12	52.62%
kerSeg (nets.)	0.10	99.13%	0.12	99.17%
gSeg (frob.)	0.52	90.12%	0.47	88.71%
kerSeg (frob.)	0.26	98.35%	0.30	98.11%

（Scenario 1，\(n=50/100\)）CPDmrdpg 几乎完美估计变点个数与位置；gSeg 在 networks 输入下 Hausdorff 距离出现 Inf（漏检/误检严重），覆盖率仅 ~52%。

置信区间评估（Table 2）¶

按 Section 3.1 构造的 95% 置信区间在大多数场景给出强覆盖率且区间长度合理；Scenario 3（违反 Model 1）覆盖率有所下降，符合理论假设被破坏的预期。即便竞品 gSeg/kerSeg 的 \(d(\widehat{C}\,|C)\) 较低，其反向距离 \(d(C\,|\widehat{C})\) 偏高，说明它们漏掉真实变点。

真实数据（全球农产品贸易网络，Table 3-4）¶

FAO 1986–2020 年（\(T=35\)）多层网络，节点为 \(n=75\) 个最活跃国家、层为 \(L=4\) 种贸易量最大的农产品。CPDmrdpg 检出 1991/1999/2005/2013 四个变点，分别对应德国统一与苏联解体、WTO 第三次部长级会议、WTO 取消农产品出口补贴协议、WTO 巴厘一揽子协议——均与已知地缘政治/政策事件吻合；gSeg 在 2010 年后完全失效，kerSeg 检出的 1990/1992 过于接近。Table 4 给出各变点的 95% 置信区间（如 14 对应 (13.98, 14.02)），区间极窄。

关键发现¶

低秩张量精修是性能分水岭：它让定位率去掉对数因子并对多层"免费"扩展。
把多层网络压成标量范数（frob.）会损失信号，但仍优于压成单图（nets.）。
数据驱动置信区间在符合模型时覆盖可靠，模型违反时会退化——诚实地暴露了方法边界。

亮点与洞察¶

首个离线多层网络变点框架：定位 + 推断（极限分布 + 置信区间）一次打通，填补 D-MRDPG 离线设定空白。
"廉价粗定位 + 低秩细定位"是可迁移的范式：种子分割负责召回、TH-PCA 负责精度，二者解耦让总成本仅 \(O(Tn^2Lr\log^2(T\vee n))\)。
双边布朗运动刻画很到位：意识到变点两侧分布不同、噪声方差非对称，给出两侧独立 \(\sigma\) 的极限分布，比单边设定更贴合网络数据。
真实数据的可解释性强：检出的贸易变点能逐一对应到 WTO 政策与地缘事件，且置信区间窄，展示了"可推断"相对"仅检测"的实用价值。

局限与展望¶

变点不能太密：\(\Delta=\Theta(T)\) 假设排除了频繁变点，作者建议改用 narrowest-over-threshold 等选择策略放松。
推断只覆盖消失跳变：非消失跳变（\(\kappa_k\to\kappa>0\)）的极限分布在附录给出，但实用的置信区间构造仍待开发，可能需借助 bootstrap。
假定时间独立：当前框架假设各时刻邻接张量相互独立，虽可扩展到时间相依（附录 B），但主结果未覆盖。
隐位置固定：主模型假设节点隐位置不随时间变化（只变层权重），更一般的隐位置漂移仅在附录 C 讨论。

评分¶

新颖性: ⭐⭐⭐⭐⭐ 离线多层网络变点的首个定位 + 推断框架，极限分布是网络变点估计量的首个结果，理论贡献扎实。
实验充分度: ⭐⭐⭐⭐ 四种模拟场景（含两种违反模型）+ 置信区间覆盖评估 + 两个真实数据集，对比 gSeg/kerSeg 充分；偏统计仿真，缺更大规模/更多竞品。
写作质量: ⭐⭐⭐⭐ 结构清晰、定理与算法对应明确、真实数据解释到位；符号密集对非统计读者门槛较高。
价值: ⭐⭐⭐⭐ 为交通/贸易/脑网络等多层动态系统提供了可定位、可推断的工具，真实数据可解释性与窄置信区间体现实用性。