DAOrayaki DAO研究奖金池:
资助地址: DAOrayaki.eth
投票进展:DAO Reviewer 1/0 通 过
赏金总量:35 USD
研究种类:Quantum Computing, Quantum Machine Learning
原文作者: Jarrod McClean
创作者:Wonder@DAOrayaki.org
审核者:Sleepygirl@DAOrayaki.org
原文: Quantum Machine Learning and the Power of Data

量子机器学习和数据的力量
作者:Jarrod McClean、研究科学家和 Hsin-Yuan(Robert)Huang、Intern、谷歌量子 AI
近年来,量子计算在理论和实践方面发展迅速,但随之而来的是人们对其在实际应用中潜在影响的期待。人们感兴趣的一个关键领域是量子计算机将如何影响机器学习。最近,我们通过实验证明了量子计算机能够自然地解决某些输入之间存在复杂关联的问题,而这些问题对于传统计算机或经典计算机来说是难以解决的。这表明,在量子计算机上建立的学习模型在某些应用领域可能会更强大,也许是拥有更快的计算速度,或者是在更少的数据上有更好的概括性,或者两者兼有之。因此,了解在哪些情况下可以实现这种「量子优势」是非常有意义的。
量子优势这一概念通常指的是「计算优势」,即如果给定一些具有明确的输入和输出任务,量子计算机能否在相同的运行时间内取得比传统机器更准确的结果?比如,在用于分解大素数乘积的秀尔因式分解算法(与 RSA 加密相关)或者量子系统的量子模拟等算法中,量子计算机被认为具有压倒性的优势。然而,解决问题的难度以及量子计算机的潜在优势,很大程度上会受到数据可用性的影响。因此,量子计算机能在何时帮助完成机器学习任务,不仅取决于具体的任务难度,也取决于可用的数据情况,想进行完整的理解必须包括这两个方面。
在《自然通讯》上发表的《量子机器学习中的数据力量》一文中,我们剖析了机器学习中的量子优势问题,以更好地理解它的适用时机。我们展示了问题的复杂性是如何随着数据可用性而改变的,以及为什么这种变化有时可以提升传统的学习模型,使其与量子算法竞争。然后,我们开发了一种实用的方法,用于筛选在核方法背景下所选的一组数据嵌入中可能存在的量子优势。我们从筛选方法和学习边界中得到了一些启示,并将量子计算机中项目特征图选择的新方法引入到了传统机器中。这使我们能够在量子方法中注入来自传统机器学习的额外见解,展现出了迄今为止在量子学习优势中的最佳经验分离。
数据的计算能力
相较于传统计算机,量子计算的优势通常在于计算复杂性类,诸如大素数分解和模拟量子系统被归类为有限错误量子多项式时间(BQP)问题。比起传统计算机,人们通常认为量子计算机更容易处理这些问题。传统计算机可以轻易解决的问题被称为有界错误概率多项式问题。
我们发现,如果学习算法中加入了完成量子过程的数据,例如像核聚变或化学反应这样的自然过程,形成了一类新的问题(我们称之为 BPP/Samp),可以有效地执行一些在无数据的情况下传统算法无法完成的任务,也是多项式大小建议(P/oly)可有效解决问题的一个分支。这表明,对于一些机器学习任务,理解量子优势也需要检查可用数据。

量子学习优势的几何测试
从结果来看,学习优势的变化是基于数据的可用性;人们可能会疑惑,从业者应该如何快速评估他们的问题是否适合量子计算机?为了帮助解决这一问题,我们开发了一个工作流程来评估内核学习框架的优势潜力。我们进行了一些测试,其中最强大和信息量最大的是我们开发的一种新型几何测试。
在量子机器学习方法中,如量子神经网络或量子核方法,量子程序通常分为两部分,一是数据的量子嵌入(使用量子计算机对特征空间的图嵌入),二是评估应用于数据嵌入的函数。在量子计算的背景下,量子核方法采用了传统核方法,通过使用量子计算机来评估量子嵌入的部分或全部核,但量子嵌入的几何形状与传统嵌入是不同的。据猜测,量子优势可能来自于量子嵌入,它可能比任何可获得的传统几何形状更适合用于解决一个特定的问题。
我们开发了一种快速而严格的测试,可以用来快速比较一个特定的量子嵌入、内核和数据集与一系列的传统内核,并评估是否有机会获得跨量子的优势,例如,用于图像识别任务的可能标签函数。我们定义了一个几何常数g,基于几何测试,它量化了理论上可以缩小该差距的数据量。这是一项非常有用的技术,可以根据数据约束决定一个量子解决方案是否适合特定问题。
投影量子核的方法
几何测试所阐述的一个观点是:现有的量子核经常受到几何学的影响,因为它们鼓励记忆而不是理解,所以很容易超越传统方法。这给了我们灵感,我们开发了一个投射量子核,其中量子嵌入被投射回传统表征。虽然这种表征仍然难以用传统计算机直接计算,但与完全停留在量子空间相比,它有许多切实的优势。

几何常数g,可以量化量子优势潜力,描述数个嵌入,包括上文提到的投影量子核
通过有选择地投射回传统空间,我们可以保留量子几何的一些体,传统计算机很难模拟这些体仍,但现在开发距离函数变得更容易,因此其内核也比原来的量子内核在输入时的变化更小一些。此外,投影量子核有利于更好地与传统计算的强大非线性核(如平方指数)相结合,这在原生量子空间中更具挑战性。
相比之前的方法,这种预测的量子核有诸多好处,包括提高现有嵌入非线性函数的描述能力,减少了从二次方到线性的数据点数量的内核处理所需资源,并且能够在更大的规模下更好地进行概括。内核还有助于扩大几何 g,这有助于发挥量子优势的最大潜力。
数据集表现出的学习优势
几何测试量化了所有可能标签函数的潜在优势,然而在实践中我们最感兴趣的是特定的标签函数。使用量子学习的理论方法,我们也约束了特定任务的泛化误差,包括那些明确的量子任务。由于量子计算机的优势在于其拥有可以同时使用许多量子比特的能力,但之前的方法在量子比特数量上的扩展性很差,所以在合理的、较大的量子比特规模(>20)下验证任务是非常重要的,以确保方法可以扩展到实际问题。在我们的研究中,我们最多验证了 30 个量子比特,这是通过开源工具 TensorFlow-Quantum 实现的,它可以使计算量达到每秒千兆次浮点运算。
我们发现了一个有趣的现象,许多自然量子问题,即使高达 30 个量子比特,只要提供了足够的数据,也很容易被传统的学习方法处理。所以我们得出了一个结论,尽管有些问题看起来只有量子计算可以解决,但在数据的支持下,传统的机器学习方法也能达到与量子计算机相匹配的能力。然而,使用几何结构与预测的量子核相结合,我们能够构建一个数据集,展现出量子模型相较于传统模型的经验学习优势。因此,虽然在自然问题中找到这样的数据集仍然是一个开放的问题,但我们能够证明存在标签函数的情况。虽然这个问题是经过设计的,而且量子计算优势需要更大和更多的嵌入,但这项工作证明了理解数据在量子机器学习中发挥着重要作用。

预测精度是量子比特数(n)的函数,该问题的设计是为了最大限度地发挥量子模型的学习优势潜力。数据显示了两种不同规模的训练数据(N)。
对于这个问题,我们扩大了量子比特的数量(n),并将预测量子内核的准确性分别与现有的内核方法、我们数据集中最好的传统机器学习模型进行了比较。此外,从这些结果中得到的一个关键启示是,尽管的确在一些数据集里,量子计算机具有优势的,但对于许多量子问题而言,传统学习方法仍然是最佳方法。在讨论学习问题中的量子优势时,一个关键因素是需要理解数据是如何影响一个给定问题的,而传统计算不需要考虑这个问题。
结论
在考虑量子计算机帮助进行机器学习的能力时,我们已经发现,数据的可用性从根本上改变了这个问题。在我们的工作中,我们开发了一套实用的工具来研究这些问题,并利用这些工具开发了一种预测量子核的新方法,相比现有的方法,这种方法比有诸多优势。我们建立了迄今为止最大的数字演示,30 个量子嵌入的潜在学习优势。虽然在现实世界应用中,完整的计算优势还有待观察,但这项工作有助于为未来的道路奠定基础。我们鼓励任何有兴趣的读者查看这篇论文和相关的 TensorFlow-Quantum 教程,能够轻松地基于此继续进行建设。
鸣谢
我们要感谢本文的共同作者:Michael Broughton、Masoud Mohseni、Ryan Babbush、Sergio Boixo 和 Hartmut Neven,以及谷歌量子 AI 团队的全体成员。此外,我们还想感谢 Richard Kueng、John Platt、John Preskill、Thomas Vidick、Nathan Wiebe、Chun-Ju Wu和 Balint Pato 提供的帮助和反馈。
通过 DAO,研究组织和媒体可以打破地域的限制,以社区的方式资助和生产内容。DAOrayaki将会通过DAO的形式,构建一个代表社区意志并由社区控制的功能齐全的去中心化媒体。欢迎通过文末方式提交与DAO、量子计算、星际移民、DA相关的内容,瓜分10000USDC赏金池!欢迎加入DAOrayaki社区,了解去中心化自治组织(DAO),探讨最新话题!
Media:https://media.daorayaki.org
Discord server: https://discord.gg/wNUPmsGsa4
Medium: https://medium.com/@daorayaki
Email: daorayaki@dorafactory.org
Twitter: @daorayaki_
微信助手:DAOrayaki-Media
小宇宙:DAOrayaki

详情请参考:
Dora Factory支持去中心化DAO研究组织DAOrayaki
DAOrayaki |DAOrayaki 开启去中心化治理2.0时代
DAOrayaki |风险投资的范式转移:无限主义基金和无限游戏
DAOrayaki |DAOrayaki dGov 模型:基于Futarchy的正和游戏
更多关于DAO的文章,关注Dorafactory,查看往期文章。