Beyond Semantic Features: Pixel-Level Mapping for Generalized AI-Generated Image Detection¶

会议: AAAI 2026
arXiv: 2512.17350
代码: 无
领域: 图像生成
关键词: AI 生成图像检测, 像素级映射, 语义偏差, 高频伪影, 跨模型泛化

一句话总结¶

提出像素级映射（pixel-level mapping）预处理方法，通过打破像素值的单调排列来抑制低频语义偏差、增强高频生成伪影，将 AI 生成图像检测的跨模型泛化准确率提升至 98.4%。

研究背景与动机¶

当前 AI 生成图像检测器的核心问题是泛化失败：在训练分布内表现优异，但面对未见过的生成模型时性能急剧下降。根源在于检测器过拟合了训练集中特定的语义偏差（semantic bias）——不同生成模型因架构和训练过程差异产生的特有模糊、纹理异常等语义级伪影，而非学习到更本质的、跨模型通用的生成痕迹。

现有减少语义影响的方法存在明显缺陷：

高通滤波：移除低频成分时不可避免地丢失有用的生成伪影信息，且无法完全消除语义干扰
Patch Shuffling：通过随机打乱图像块限制感受野，但实验表明即使在最小 patch size=2 时，模型仍能从打乱的块中提取语义信息（ImageNet 分类仍可收敛）
NPR 残差操作：频域操作无法完全分离语义与生成伪影的耦合

方法详解¶

整体框架¶

整体流程极其简洁：输入图像 → 像素级映射模块（预处理）→ 分类头（ResNet-50）→ 二分类输出。像素级映射只是一个固定的查找表变换，不引入任何可学习参数。

关键设计¶

1. Fixed Pixel-Level Mapping（固定像素映射）

对每个像素值 \(v \in [0, 256)\) 应用变换：

\[\phi_f(v) = v - \text{round}\left(\frac{v}{256}, 2\right) \times 256\]

其中 round(·, 2) 是保留 2 位小数的四舍五入。这个简单公式的效果是：

打破像素值单调排列：原本相邻的像素值（如 127, 128）映射后可能差距很大，使得原本平滑的低频区域被转化为高频信息
保留像素间局部相关性：不同于 shuffling 打乱空间位置，像素映射保持了像素的空间排列不变
自动归一化：映射后的值近似落在 [-1.28, 1.28] 范围内

decimals=2 的选择有据可依：decimals=1 因量化过粗（1/256 ≈ 0.0039）保留了线性关系，而 decimals>1 有效打破单调性，decimals=2 恰好同时实现归一化。

2. Random Pixel-Level Mapping（随机像素映射）

为验证"具体映射关系不重要，关键在于打破单调排列"的假说，设计了随机映射变体：

\[T_c \sim \mathcal{U}(-1, 1)^{256}, \quad c \in \{0, 1, 2\}\]

对每个样本的每个通道独立生成一个随机映射表，然后通过查表变换：\(I'_c[x,y] = T_c[I_c[x,y]]\)。

关键发现：随机映射与固定映射的检测精度相当，证实了核心有效机制不在于特定映射关系，而在于对单调像素排列的破坏。

3. 为什么有效的理论分析

语义偏差主要存在于图像的低频成分中（平滑区域）
生成伪影与高频细节相关
CNN 分类器对低频特征存在归纳偏置，导致训练中语义主导
像素映射通过放大相邻像素差异，将低频信息转化为高频，同时保留像素间相关性
频谱分析证实：映射后低频与高频的能量差距显著缩小，频域能量分布更均匀

损失函数 / 训练策略¶

标准二分类交叉熵损失：\(\mathcal{L} = -\frac{1}{N}\sum_{i=1}^{N}[y_i \log f_\theta(x_i) + (1-y_i)\log(1-f_\theta(x_i))]\)
ResNet-50 backbone，Adam 优化器，lr = \(2 \times 10^{-4}\)
训练 200 epochs，batch size 128，8× NVIDIA 3090
训练时随机裁剪 128×128 避免 resize 偏差，测试时中心裁剪

实验关键数据¶

主实验¶

表 1：Cross-GAN 泛化（ProGAN 4 类训练，9 个 GAN 模型测试，ACC/AP）

方法	S3GAN	SNGAN	STGAN	Mean ACC
UnivFD	85.2	77.6	74.2	77.6
NPR	79.0	88.8	98.0	93.2
Fixed-mapping	85.2	99.1	99.9	97.9
Random-mapping	77.4	98.3	99.9	96.9

表 2：GenImage 数据集跨模型泛化（SDv1.4 训练，ACC）

方法	Midjourney	SDv1.4	SDv1.5	ADM	GLIDE	Wukong	VQDM	BigGAN	mAcc
UnivFD	93.9	96.4	96.2	71.9	85.4	94.3	81.6	90.5	88.8
C2P-CLIP	88.2	90.9	97.9	96.4	99.0	98.8	96.5	98.7	95.8
Fixed-mapping	96.8	98.9	98.8	98.7	98.4	98.2	98.8	98.8	98.4

表 3：不同语义削减方法对比（GenImage, SDv1.4 训练）

方法	mAcc	mAP
ResNet-50 (baseline)	67.0	76.9
高通滤波	64.4	70.2
Patch shuffle (size=8)	70.7	80.6
Patch shuffle (size=2)	50.5	51.0
NPR	88.6	93.7
Fixed-mapping	98.4	99.8

消融实验¶

高通滤波反而比 baseline 差：丢弃低频时一并丢失了有用信息
极小 patch shuffle (size=2) 完全失效：过度碎片化阻止了有意义的特征学习
随机 vs 固定映射性能接近：验证了"打破单调性"是核心机制，而非特定映射关系
频谱分析：映射方法显著均衡了低高频能量分布，而 shuffle 方法虽减弱低频但未增强高频

关键发现¶

简单的像素值查表变换即可超越所有 SOTA 方法（包括使用预训练大模型的 C2P-CLIP）
在 MidJourney 等高分辨率商业模型上依然有效，说明方法对分辨率偏差具有鲁棒性
t-SNE 可视化显示映射后的特征能有效分离真实/生成图像，且分离度优于 NPR

亮点与洞察¶

极致的简洁性：核心方法仅是一个查找表操作，零额外参数，零额外计算成本，却带来显著性能提升
深刻的实验洞察：证明了 ImageNet 分类器在 patch shuffle size=2 时仍能学到语义信息，揭示了现有语义削减方法的本质缺陷
随机映射实验：优雅地验证了因果机制——关键不在于具体映射，而在于打破像素单调排列
频域分析透彻：将频域能量分布可视化，直观展示了方法如何均衡低高频能量

局限与展望¶

仅使用 ResNet-50 作为 backbone，未探索与预训练大模型（CLIP 等）的结合
固定映射对所有样本使用相同变换，可能存在被对抗攻击利用的风险
映射后图像对人眼不可读，无法做人工质检
未讨论对图像后处理（JPEG 压缩、社交媒体传播等）的鲁棒性
decimals 参数的选择空间有限，缺乏更深入的理论指导

评分¶

新颖性: ⭐⭐⭐⭐ — 极简的方法达到 SOTA，像素映射视角新颖
技术深度: ⭐⭐⭐ — 方法本身简单，但分析（频谱、t-SNE、随机映射验证）较为深入
实验充分性: ⭐⭐⭐⭐ — 覆盖 GAN/Diffusion 两大类生成模型，多数据集多对比方法
实用价值: ⭐⭐⭐⭐⭐ — 零成本预处理步骤可直接集成到任何检测器，实用性极高