DAOrayaki |量子深度学习:量子卷积神经网络的快速指南

DAOrayaki |量子深度学习:量子卷积神经网络的快速指南

DAO研究奖金池:

资助地址:  DAOrayaki.eth

投票进展:DAO Reviewer  1/0 通 过

赏金总量:35 USD

研究种类:Quantum Computing, Quantum Convolutional Neural Networks

原文作者:   Holly Emblem

创作者:Sylvia@DAOrayaki.org

审核者:Tan Zhi Xuan@DAOrayaki.org

原文:  Quantum Deep Learning: A Quick Guide to Quantum Convolutional Neural Networks

关于量子卷积神经网络(QCNN)你需要知道的一切,包括了与经典计算方法相比,这些方法的优点和局限性。

位于芬兰埃斯波的 IQM 量子计算机,摄影者——Ragsxl

近年来,对量子计算的投资大幅增加,安全和网络通信等领域的量子方法有望颠覆现有的经典计算技术。

Garg 和 Ramakrishnan 等研究人员认为,量子计算的核心是“通过计算成本更低的技术解决经典难题”。正如近年来深度学习和量子计算的研究并行发展一样,许多人现在正在研究这两个领域的交叉的可能性:量子深度学习,而这也许不足为奇。

在本文中,我们将在高层次上讨论量子深度学习的现有研究和应用,重点是混合量子卷积神经网络  (QCNN)。首先,我们提供一个与经典计算相比的量子计算的简要定义。从这里开始,量子纠缠与纠缠态及其应用。

接下来,将讨论经典卷积神经网络(CCNN,或 CNN)的概述。最后,讨论 QCNN 及其性能,以及这些方法的优点和局限性。

经典计算和量子计算之间的区别

如果你对量子计算完全陌生,一个重要的介绍性概念是经典计算(我们通常用于计算任务)和量子之间的区别。在经典计算机上,当程序执行时,编译器用于将程序的语句转换为二进制位上的操作。

与经典计算机上的比特在任何时候都代表 1 或 0 不同,量子比特能够在这两种状态之间“悬停”。只有当被测量时,量子比特才会“坍缩”到它的一种状态。

此属性称为叠加,对量子计算任务至关重要(Ganguly,Cambier,2021)。通过叠加,量子计算机可以并行执行任务,不需要完全并行的架构或 GPU 来处理并行计算任务。这是因为如果每个叠加状态对应一个不同的值,如果对叠加状态进行操作,则该操作同时在所有状态下执行。

叠加量子态的一个例子如下:

其中,a 和 b 指的是概率振幅,它给出了一旦执行测量就投射到某个状态的概率。叠加量子态是通过使用量子逻辑门创建的。如果你对 Bra-ket 符号感到陌生,那么强烈推荐你去看看 Perry 的《量子计算的殿堂》。

纠缠简介

正如叠加是量子物理学中的一个重要原理一样,另一个需要讨论的关键领域是纠缠。纠缠是指在两个或多个粒子之间以某种方式产生或引起相互作用的行为,这意味着这些粒子的量子态不再能够相互独立地描述,即使相隔很远也是如此。当粒子被纠缠时,如果一个粒子被测量,那么与之纠缠的另一个粒子将立即测量为相反的状态(这些粒子没有局部状态)。

纠缠——贝尔态

随着对量子比特和纠缠的理解的发展,现在可以讨论贝尔态了。这些是量子比特的最大纠缠态,它们分别是:

|00⟩ → β → 1 √ 2 (|00⟩ + |11⟩) = |β00⟩,

|01⟩ → β → 1 √ 2 (|01⟩ + |10⟩) = |β01⟩

|10⟩ → β → 1 √ 2 (|00⟩ − |11⟩) = |β10⟩

|11⟩ → β → 1 √ 2 (|01⟩ − |10⟩) = |β11⟩

贝尔态是由以下量子电路创建的:

贝尔态电路,来自 Perry 的《量子计算的殿堂》

这里显示了一个贝尔状态电路,它接受量子比特输入并应用 Hadamard 和 CNOT 门来创建一个纠缠的贝尔态。

虽然理解不同的量子门超出了本文的范围,但鉴于旋转门和 CNOT 门将作为 QCNN 部分的讨论内容,建议使用以下指南

备注:原文中这个指南的链接无效,打不开。

贝尔态已被用来开发一系列量子计算应用程序。例如,Hegazy、Bahaa-Eldin 和 Dakroury 提出了贝尔状态和超密集编码可用于实现“无条件安全”的理论

经典深度学习:卷积神经网络

在介绍了量子计算之后,我们现在将讨论深度学习的经典方法,特别是卷积神经网络 (CNN)。

正如 François Chollet 在《Python 深度学习》中所指出的那样,卷积神经网络 (CNN) 已被证明在图像分类等任务中很受欢迎,因为它们能够构建模式的层次结构,例如首先表示线条,然后表示这些线条的边缘。这使得 CNN 能够在各层之间建立信息,并代表复杂的视觉数据。

CNN 具有卷积层,由过滤器组成,这些过滤器在输入中“滑动”并产生“特征图”,允许检测输入中的模式。 CNN 还使用池化层来减小特征图的大小,从而减少学习所需的资源。有关这方面的更多信息,强烈推荐大家去看看 Oh, Choi 和 Kim 的 2020 年 CNN 指南

由 Cecbur 展示的卷积神经网络(CNN)

量子卷积神经网络——混合网络示例

回到正题,定义了经典的 CNN 后,现在可以探索量子 CNN 如何利用这些传统方法并对其进行扩展。 Garg 和 Ramakrishnan 认为,开发量子神经网络的一种常见方法是开发一种“混合”方法,引入所谓的“量子卷积层,一种基于随机量子电路的变换,作为经典 CNN 中的附加组件”。

在本节中,我们将讨论由 Lü 等人开发并在 MNIST 手写数字数据集上进行测试的混合 QCNN。对于他们的混合 QCNN,Lü 等人在他们 2021 年的论文中使用量子电路和纠缠作为经典模型的一部分来获取输入图像,然后生成预测作为输出。

在这种方法中,量子卷积神经网络(QCNN)将图像数据作为输入,并将其编码为量子状态|x>,然后对其进行转换,接着使用量子卷积和池化层提取特征(Lü 等人,2021)。

最后,使用强纠缠电路的全连接层进行分类,并通过测量获得预测结果(Lü 等人,2021)。

用于减少训练数据标签和 QCNN 预测的标签之间差异的优化,由随机梯度下降(SGD)处理。着眼于量子电路,量子卷积层中使用的门如下所示,结合了旋转和 CNOT 门运算符号。

在池化层中,一个量子比特的子集被测量,然后得出的结果决定是否对其比邻的单量子比特门进行应用:

全连接层由“通用单量子比特门”和产生纠缠态的 CNOT 门组成。为了将 QCNN 与其他方法进行对比,Lü 等人使用了带有模拟 QCNN 的 MNIST 数据集。按照典型方法,创建了一个训练/测试数据集,并开发了一个由以下层组成的 QCNN:

● 2 个量子卷积层

● 2 个量子汇集层

● 1 个量子全连接层

该 QCNN 对数据集的测试集准确率达到了 96.65%。相比之下,根据 Papers with Code 的数据,该数据集在经典 CNN 中的最高准确率为 99.91%。然而,需要注意的是,在这个实验中,只对 MNIST 数据集的两个类别进行了分类,这意味着与其他 MNIST 模型性能的全面比较是有些局限的。

评估 QCNN 的可行性

虽然像 Lü 等研究人员已经开发了量子 CNN 的方法,但该领域的主要挑战之一是实现理论模型所需的硬件尚不可用。除此之外,还存在与混合方法相关的挑战,这些方法在 CNN 的经典计算方法中引入了量子进化层。

如果我们考虑量子计算的主要好处之一是可以解决“通过计算成本更低的技术解决经典难题”,那么这些解决方案的一个重要方面就是“量子加速”:在探索量子机器学习的好处时, Phillipson(2020)提出,与经典实现相比,预计量子算法将具有多项式甚至指数级的加速时间。然而,Lü 等人的方法的一个局限性是,“量子加速”增益对于需要对经典数据和测量进行一致解码/编码的算法(例如 QCNN)是有限的。 Aaronson 和 Henderson 等人在各自的论文中都对此进行了讨论。目前关于如何最好地设计编码/解码和需要最少测量的协议以从“量子加速”中受益的信息是有限的。

更广泛地说,纠缠已被证明是量子机器学习的重要属性。 Lü 等人提出的 QCNN 利用了强纠缠电路,它可以生成纠缠态作为其全连接层,从而允许模型进行预测。纠缠已在其他地方用于辅助深度学习模型,例如 Liu 等人使用纠缠从图像中提取重要特征。此外,Sharma 等人发现,在数据集中使用纠缠可能意味着模型能够从比以前预期的更小的训练数据集中学习,从而完善了所谓的“无免费午餐”定理

关于 QCNN 的结论

本文提供了经典深度学习方法和量子深度学习方法的比较,同时概述了 QCNN,它利用量子层,包括强纠缠电路,来产生预测。我们也讨论了量子深度学习的优点和局限性,包括纠缠在机器学习中更普遍的应用。

考虑到这一点,现在可以考虑量子深度学习的下一步,特别是 QCNN。 Garg 和 Ramakrishnan 发现,除了图像识别之外,量子方法已经开始在自然语言处理(NLP)等领域得到发展,例如 Galofaro 等人检测仇恨言论的工作

除此之外,我们还看到了量子硬件的进步,比如 PsiQuantum 等公司的目标是开发百万量子比特的量子处理器。因此,虽然我们已经看到应用量子神经网络存在的一些挑战,但随着在深度学习和量子计算的 "关口 "继续进行研究,我们可以期待看到量子深度学习的进一步发展。

相关资源

对于那些感兴趣的人,除了文章中的链接之外,还提供了有关相关量子计算和深度学习资源的小型参考书目,如下所示:

Aaronson, S. (2015) “Read the fine print”, Nature Physics, 11(4), pp. 291–293. doi: 10.1038/nphys3272.

Biamonte, J. et al.. (2017) “Quantum machine learning”, Nature, 549(7671), pp. 195–202. doi: 10.1038/nature23474.

Chollet, F., (2021). Deep Learning with Python. Second Edition. Shelter Island (New York, Estados Unidos): Manning.

Ganguly, S. and Cambier, T., 2021. Quantum Computing with Silq Programming. Packt.

Garg, S. and Ramakrishnan, G. (2020) Advances in Quantum Deep Learning: An Overview, arXiv.org. Available at: https://arxiv.org/abs/2005.

Hegazy, O., Bahaa-Eldin, A. and Dakroury, Y. (2014) Quantum Secure Direct Communication using Entanglement and Super Dense Coding, arXiv.org. Available at: https://arxiv.org/abs/1402.6219

Henderson, M. et al., (2019) Quanvolutional Neural Networks: Powering Image Recognition with Quantum Circuits, arXiv.org. Available at: https://arxiv.org/abs/1904.04767

Karn, U. (2016) An Intuitive Explanation of Convolutional Neural Networks — KDnuggets. Available at: https://www.kdnuggets.com/2016/11/intuitive-explanation-convolutional-neural-networks.html

Liu, Y. et al., (2021) “Entanglement-Based Feature Extraction by Tensor Network Machine Learning”, Frontiers in Applied Mathematics and Statistics, 7. doi: 10.3389/fams.2021.716044.

Lü, Y. et al., (2021) A Quantum Convolutional Neural Network for Image Classification, arXiv.org. Available at: https://arxiv.org/abs/2107.03630.

Mehta, N., 2020. Quantum Computing. [S.l.]: Pragmatic Bookshelf.

Ofcom, (2021) Quantum Communications: new potential for the future of communications Available at: https://www.ofcom.org.uk/__data/assets/pdf_file/0013/222601/Executive-Summary.pdf

Oh, S., Choi, J. and Kim, J. (2020) A Tutorial on Quantum Convolutional Neural Networks (QCNN), arXiv.org. Available at: https://arxiv.org/abs/2009.09423

Pattanayak, S., (2021). Quantum Machine Learning with Python: Using Cirq From Google Research and IBM Qiskit. Apress.

Phillipson, F (2020). Quantum Machine Learning: Benefits and Practical Examples. Available at: http://ceur-ws.org/Vol-2561/paper5.pdf

Perry, T. R. (2004). The Temple of Quantum Computing: Version 1.1 — April 29, 2006. Riley T. Perry.

Sewak, Karim, Pujari, P (2018). Practical convolutional neural networks. Birmingham: Packt.

Sharma, K. et al. (2022) “Reformulation of the No-Free-Lunch Theorem for Entangled Datasets”, Physical Review Letters, 128(7). doi: 10.1103/physrevlett.128.070501.

Voorhoede, D. (2022) Superposition and entanglement, Quantum Inspire. Available at: https://www.quantum-inspire.com/kbase/superposition-and-entanglement/


通过 DAO,研究组织和媒体可以打破地域的限制,以社区的方式资助和生产内容。DAOrayaki将会通过DAO的形式,构建一个代表社区意志并由社区控制的功能齐全的去中心化媒体。欢迎通过文末方式提交与DAO、量子计算、星际移民、DA相关的内容,瓜分10000USDC赏金池!欢迎加入DAOrayaki社区,了解去中心化自治组织(DAO),探讨最新话题!

官方网站:https://daorayaki.org

Media:https://media.daorayaki.org

Discord server: https://discord.gg/wNUPmsGsa4

Medium: https://medium.com/@daorayaki

Email: daorayaki@dorafactory.org

Twitter: @daorayaki_

微信助手:DAOrayaki-Media

小宇宙:DAOrayaki

详情请参考:

Dora Factory支持去中心化DAO研究组织DAOrayaki

对DAOrayaki第一阶段的回顾--去中心化媒体的先驱

DAOrayaki |DAOrayaki 开启去中心化治理2.0时代

DAOrayaki |风险投资的范式转移:无限主义基金和无限游戏

DAOrayaki |DAOrayaki dGov 模型:基于Futarchy的正和游戏

更多关于DAO的文章,关注Dorafactory,查看往期文章。

Category:

DAOrayaki

DAOrayaki is a decentralized media and research organization that is autonomous by readers, researchers, and funders.

More posts from this author