《Connection Science》:Modified transfer learning based variational quantum circuit for MNIST image classification
编辑推荐:
本文提出了一种结合深度残差网络(ResNet)、Inception模块与变分量子电路(VQC)的混合模型,用于提升MNIST手写数字识别任务的分类精度与噪声鲁棒性。该模型通过量子编码层将经典图像特征映射为量子态,利用VQC的可调参数实现高效优化,在保留ResNet梯度流优势与Inception多尺度特征提取能力的同时,显著降低了传统方法中的计算冗余与误差概率。实验结果表明,其对样本(0,1)和(3,6)的分类准确率分别达到100%与99.78%,为量子机器学习(QML)在图像分类领域的应用提供了新范式。
摘要
手写数字识别(HWR)技术广泛应用于金融、医疗等领域,但传统光学特征识别(OCR)等方法存在精度不足的问题。本研究提出一种结合深度ResNet-Inception模型与变分量子电路(VQC)的混合框架,通过量子编码层将MNIST数据集中的图像特征转换为量子态,利用VQC的参数量子门(如RX、RY、RZ)和纠缠门(如CNOT)优化分类过程。实验选取样本(0,1)和(3,6),结果显示其分类准确率分别达100%与99.78%,显著优于传统卷积神经网络(CNN)及矩阵乘积态-VQC(MPS-VQC)等方法。
1 引言
量子计算通过量子比特(qubit)的叠加态与纠缠特性,可高效处理图像去噪、分割等复杂任务。传统CNN需大量数据训练,易出现过拟合,而迁移学习可通过预训练模型(如ResNet、Inception)提升量子卷积神经网络(QCNN)的泛化能力。本研究将ResNet的残差连接与Inception的多尺度卷积结合,通过变分量子电路(VQC)增强噪声环境下的模型鲁棒性,避免使用量子纠错机制。
2 现有工作综述
现有量子图像分类方法如量子卷积神经网络(QCNN)依赖两量子比特交互,但特征提取能力有限;混合量子经典分类器(如TN-VQC)因层数不足导致性能下降。此外,图像降采样会造成特征模糊,增加分类不确定性。相比之下,本研究通过量子角度编码与参数化量子电路,实现了高维特征空间中的高效分类。
3 方法论
3.1 深度混合ResNet-Inception机制
模型包含13个层级,参数总量19,194,采用残差模块(公式3-4)与并行卷积核(公式1)提取特征。其中,ReLU激活函数(公式2)与平均池化(公式5)用于降低计算复杂度。
3.2 量子编码层
使用4量子比特电路,将28×28像素图像通过角度编码映射为量子态(公式6-7),旋转角θi=π×bi(公式9-10),例如数字11(二进制1011)编码为|1011?态。
3.3 变分量子电路
VQC包含编码层、变分层与测量层,通过Rj(θ)=e?iθσj/2(公式8)实现参数优化,最终输出经Softmax分类器处理(算法II)。
4 结果与讨论
4.1 数据集与预处理
MNIST数据集包含60,000训练样本与10,000测试样本,本研究聚焦样本(0,1)与(3,6)。
4.2 性能指标
准确率(公式18)、精确度(公式16)、召回率(公式17)与F1分数(公式19)用于评估模型。
4.3 实验结果
样本(0,1)训练准确率99.97%,测试准确率100%;样本(3,6)测试准确率99.78%,损失值降至0.9203,优于传统模型(准确率87.34%)与MPS-VQC(99.44%)。K折交叉验证进一步验证模型稳定性(表4)。
4.4 讨论
VQC通过参数化量子门自适应学习噪声特征,无需量子纠错即实现高精度分类,为量子机器学习(QML)在边缘设备上的应用提供可能。
5 结论
ResNet-Inception与VQC的混合框架显著提升MNIST分类精度,未来可扩展至CIFAR-100等复杂数据集,或探索量子支持向量机(QSVM)等架构在多任务学习中的潜力。