Novel Architecture of RPA In Oral Cancer Lesion Detection¶

会议: CVPR 2026
arXiv: 2603.10928
代码: 无
领域: 医学图像 / 口腔癌检测
关键词: 口腔癌检测, RPA自动化, EfficientNetV2, 设计模式, CNN分类

一句话总结¶

将软件设计模式（Singleton + Batch Processing）集成到基于 EfficientNetV2B1 的口腔癌病变检测 Python 流水线中，相比传统 RPA 平台（UiPath/Automation Anywhere）实现 60-100x 推理加速（每张图 0.06s vs 2.58s），同时保持诊断准确性。

研究背景与动机¶

领域现状：口腔癌早期检测对患者生存率至关重要。RPA（机器人流程自动化）已被引入医疗领域自动化重复性工作流，如图像处理、实验数据管理和患者数据分析。UiPath、Automation Anywhere 等低代码 RPA 平台提供了易用的工作流编排能力。

现有痛点：(1) 传统 RPA 平台在计算密集型 AI 推理场景下效率极低——约 78% 的处理时间用于模型重复加载、活动切换和数据序列化，仅 22% 用于实际推理；(2) 低代码环境天然不支持 GPU 批处理和模型缓存，串行图像处理导致严重瓶颈；(3) 计算资源利用率低，临床高通量场景下成本和延迟不可接受。

核心矛盾：RPA 平台的工作流编排优势与其计算效率劣势之间的矛盾——需要在保持自动化流程管理的同时大幅提升推理效率。

本文目标 通过软件工程设计模式优化 Python 推理流水线，在保持 RPA 工作流编排优势的同时实现高效推理。

切入角度：将 Singleton（模型单次加载）和 Batch Processing（批量推理）设计模式引入 AI 临床部署流水线。

核心 idea：Singleton 消除模型重复加载开销 + Batch Processing 利用 GPU 并行计算 = 60-100x 加速。

方法详解¶

整体框架¶

系统分为两条并行流水线：OC-RPAv1（基本 Python 流水线，逐张处理）和 OC-RPAv2（优化流水线，引入 Singleton + Batch Processing）。UiPath 管理自动化流水线，调用 Python 函数执行推理。两条流水线使用同一 CNN 模型。

关键设计¶

Singleton 设计模式（消除模型重复加载）:
- 功能：确保 CNN 模型全生命周期仅加载一次并常驻内存
- 核心思路：传统 RPA 流水线中每次预测都重新实例化模型，Singleton 模式将模型加载与推理解耦，统一模型生命周期管理
- 设计动机：模型加载和数据序列化占传统 RPA 总时间的 ~78%，这是最大的性能瓶颈。消除重复加载是最关键的单点优化
Batch Processing 设计模式（GPU 并行推理）:
- 功能：将多张图像组成批次一次性送入模型推理
- 核心思路：利用 GPU 并行计算能力，减少逐张推理的 kernel 启动和内存传输开销。每张图像处理完成后自动记录结果并移至独立目录确保数据完整性
- 设计动机：在 Singleton 基础上进一步压缩推理时间（OC-RPAv1 的 0.28s/张 -> OC-RPAv2 的 0.06s/张，再提速 4.7x）
CNN 分类模型（EfficientNetV2B1）:
- 功能：口腔病变 16 类分类
- 核心思路：以 ImageNet 预训练 EfficientNetV2B1 为骨干，输入 224x224x3，末层替换为 softmax 全连接层。两阶段训练：冻结 backbone 训 15 epochs（lr=1e-3），部分解冻 fine-tune 10 epochs（lr=1e-5）
- 数据集：~3000 张口腔临床图像，4 大类（Healthy/Benign/OPMD/Oral Cancer）共 16 子类。使用 Albumentations 做 5 种增强，不足 200 样本的类别做随机复制

损失函数 / 训练策略¶

损失函数：Categorical cross-entropy
优化器：Adam，batch size=32
数据划分：分层采样 70%/15%/15%
训练技巧：Early stopping、模型检查点（保存最佳验证精度）、ReduceLROnPlateau（loss 停滞时学习率减半）

实验关键数据¶

主实验（31 张测试图推理效率对比）¶

平台/方法	31张图总耗时	平均每张耗时	相对加速比
UiPath	80 s	2.58 s	1x（基线）
Automation Anywhere	75 s	2.42 s	1.07x
OC-RPAv1（Python 基础）	8.65 s	0.28 s	9.2x
OC-RPAv2（Python+设计模式）	1.96 s	0.06 s	43x

消融/效率分析¶

分析维度	关键数据	说明
RPA 平台开销分析	~78% 用于非推理操作	模型加载/数据序列化是主要瓶颈
Singleton 贡献	v1(0.28s) vs RPA(2.58s)	消除重复加载实现 9.2x 加速
Batch Processing 贡献	v2(0.06s) vs v1(0.28s)	GPU 并行进一步 4.7x 加速
规模化估算	2500张：UiPath 需 1.8h，v2 不到 3min	40x 运营效率提升

关键发现¶

RPA 平台在计算密集任务上效率极低，大部分时间消耗在非推理开销上
Singleton 模式消除模型重复加载是最大的性能提升来源（~9x）
设计模式的引入不影响诊断准确性，仅优化执行效率
Python 计算 + RPA 流程编排的混合方案是最佳实践

亮点与洞察¶

首次系统性量化传统 RPA 平台在 AI 推理场景下的效率瓶颈（78% 开销用于非推理）
将 Singleton 和 Batch Processing 设计模式引入 RPA 医学图像分析流水线
提供了 RPA + Python 混合自动化的可复用模式
结论简单但实用：AI 模型的临床部署中，工程优化的价值可能不亚于算法改进

局限与展望¶

数据规模极小：仅 31 张测试图像，统计说服力严重不足
缺乏准确性对比：未报告分类准确率/精度/召回率等指标，缺少不同方法间的诊断性能对比
模型本身无创新：直接使用 EfficientNetV2B1，无架构改进或针对口腔病变的适配
写作质量不高：结构松散，存在重复段落，部分引用不够严谨
临床深度不足：仅关注推理速度，未涉及可解释性、不确定性量化等临床关键需求
未来可探索 Factory/Adapter/Observer 等更多设计模式的集成

评分¶

⭐⭐ (2/5)

新颖性 ⭐⭐：将已有设计模式应用于 RPA 流水线，算法层面无创新
实验充分度 ⭐⭐：测试规模极小（31张），缺乏准确性指标对比
写作质量 ⭐⭐：结构松散，重复段落较多，部分引用不规范
价值 ⭐⭐⭐：对 AI 临床部署的工程实践有参考意义，但学术贡献有限