《Computer Physics Communications》:Effects of the entropy source on Monte Carlo simulations
编辑推荐:
量子随机数生成器(QRNG)在蒙特卡洛模拟中的表现优于传统伪随机数生成器(PRNG),尤其在π近似和样本效率方面显著提升。
安东·列别杰夫(Anton Lebedev)| 安妮卡·莫斯莱因(Annika M?slein)| 奥尔哈·亚曼(Olha Yaman)| 德尔·拉詹(Del Rajan)| 菲利普·因塔卢拉(Philip Intallura)
英国沃灵顿的哈特里中心(The Hartree Centre, Warrington, UK)
摘要
在本文中,我们展示了不同随机数来源如何影响蒙特卡洛(Monte Carlo)模拟的结果。我们将行业标准伪随机数生成器(PRNGs)与量子随机数生成器(QRNG)进行了比较,并通过具有精确解的蒙特卡洛模拟示例表明,QRNG在统计上提供了比PRNGs更准确的近似结果。以布丰针实验(Buffon’s needle experiment)为例,当使用QRNG时,通过选择最佳参数,近似误差可降低多达1.89倍;而在选择次优参数时,样本量可减少约8倍。我们认为这种更高精度是由于随机抽样的根本差异所致,均匀性分析显示QRNG在抽样解决方案空间时更为均匀。
引言
随机模拟是当今科学和工业中大规模计算机模拟的最早应用之一。蒙特卡洛(MC)模拟利用随机数作为解决随机问题的关键部分,最初由冯·诺伊曼(von Neumann)和乌拉姆(Ulam)在曼哈顿计划期间开发,至今仍被用于放射治疗规划[1]、蛋白质折叠[2]、粒子方法[3][4]以及社会隔离模型[5][6]等领域。由随机微分方程(SDE)描述的随机过程演化是金融行业的基石(例如布莱克-斯科尔斯方程),同时也是光学系统开发[7][8]和高精度测量的基础[9]。随机微分方程的数值解是蒙特卡洛方法的一种特定形式。此外,随着不确定性量化在建模中的广泛应用,以及现实世界观测数据的随机性,蒙特卡洛方法已扩展到之前仅处于边缘地位的领域[10]。
上述所有领域的基础都是在用于模拟的平台上能够获得随机数。然而,众所周知,系统库中提供的所有“随机”数实际上都是由算法生成的确定性序列,因此并非真正随机[11]。过去的错误,如高度相关的RANDU生成器[12],促使了高质量伪随机数生成器(PRNGs)的发展,其中梅森扭绞(Mersenne Twister,MT)[13]如今被视为行业标准,被Python[14](以及NumPy 1.15版本之前[15])默认采用,并且是C++中引入PRNG的常见示例[16]。后者在科学计算中非常普遍,还有多种易于使用的PRNG,如“最小标准”线性同余生成器[17]和RANLUX生成器[18]。此外,还可以将加密安全的PRNG与类Unix系统中的软件定义无线电结合使用,以获得硬件真随机数生成器(HWTRNG)。
利用单程序多数据模型的蒙特卡洛方法在科学应用中特别受欢迎,因为它们实现和并行化相对容易,能够充分利用所有可用的计算资源。然而,上述PRNG通常不适合实际的并行应用。为填补这一空白,出现了诸如Tina的随机数生成器库[19]或可扩展并行随机数生成器库[20]等并行PRNG库。如果每个计算设备都能配备无线电,HWTRNG似乎适用于并行应用。不幸的是,由于相关软件不再维护,这种方法并不推荐使用。
给定某些参数后,PRNG会从周期性数列中生成一个数。通常,这些参数包括一个“种子”和迭代次数,尽管迭代次数通常由PRNG内部计数器维护。种子决定了序列的起始位置,相同的种子总是会产生相同的数列。使用固定种子便于测试软件的基本功能,从而促进软件开发,但在统计分析中则存在很大疑问。
尽管目前存在多种随机数来源,但对它们输出质量的评估却相当有限。Dieharder[21]、[22]和TestU01[23]是常用的测试套件,用于验证RNG是否提供足够随机的比特序列[3][24]。然而,这些测试套件在实际蒙特卡洛模拟中的实用性仍有争议,人们尝试使用伊辛模型[25][26]等来研究RNG的实际效果。过去十年量子技术的进步使得量子随机数生成器(QRNGs)得以商业化,它们基于量子物理中的不确定性原理,能够生成高质量的随机数。尤其是自认证光学QRNGs,能够从受电子噪声隔离的量子系统中真正提取随机性,并且具有高吞吐量[27]。
正如Cirauqui等人在[28]中所展示的,对相关性敏感的问题适合用于分析RNG的质量。在该研究中,可观测量是由自旋计算得出的,而自旋又直接依赖于提供的随机数序列,因此可以作为RNG序列中相关性的有效代理指标。有人可能会认为,基准测试是针对周期短于C++中采用的“最小标准”PRNGs进行的,而这些PRNG在实际蒙特卡洛模拟中并不存在。作者们证明,通过频繁重新播种(使用不同的PRNG或真随机数生成器),LCGs的相关性可以显著改善。
在本文中,我们展示了QRNG比上述行业标准梅森扭绞PRNG、常见的线性同余生成器(LCG)以及专用的并行乘法递归生成器(MRG)在更简单、运行时间更短的模型中提供了更好的近似结果。虽然RANLUX PRNG和HWTRNG在质量上似乎优于梅森扭绞,但它们的速度极慢(快慢可达17倍),因此由于数据收集不可行(见附录A.1.4),在分析中被排除在外。接下来,我们将介绍用于研究各种随机数来源适用于蒙特卡洛应用的模型,以及用于确定观察结果显著性的测试方法。
结果
一般来说,蒙特卡洛模拟会对未知分布进行采样,从而提供该分布的实证近似值。我们选择经典的π/4蒙特卡洛近似方法作为初始随机测试平台,以评估不同随机性来源对模拟结果的影响。这一选择基于该方法的精确解的可用性、程序的简单性以及其作为MC方法通用示例的特点。我们使用了可能最著名的π/4方法
结论
在这项工作中,我们评估了各种熵来源对随机模拟结果的影响。为此,我们构建了一个基于蒙特卡洛模拟的测试套件和一系列具有不同假设的统计测试,用于比较量子随机数生成器(QRNG)与伪随机数生成器(PRNG)在串行和并行过程中的表现。选择π的随机估计是因为其简单性和精确解的可用性。
作者贡献
概念化:所有作者。方法论:统计分析:AL、OY;硬件:AM。软件:测试平台:AL;接口设计:AM、AL。验证:AL、OY。形式分析:AL、OY。调查:所有作者。资源:所有作者。数据管理:AL。写作:AL、AM、OY。项目管理:AM、AL、DR。资金获取:所有作者。
CRediT作者贡献声明
安东·列别杰夫(Anton Lebedev):写作——审阅与编辑、初稿撰写、可视化、验证、监督、软件开发、资源管理、项目管理、方法论研究、资金获取、形式分析、数据管理、概念化。安妮卡·莫斯莱因(Annika M?slein):写作——审阅与编辑、初稿撰写、软件开发、资源管理、项目管理、方法论研究、资金获取、概念化。奥尔哈·亚曼(Olha Yaman):写作——审阅与编辑、初稿撰写
利益冲突声明
Quantum Dice Ltd. 本研究中使用的QRNG由Quantum Dice Ltd.开发。汇丰银行(HSBC):作者声明没有利益冲突。本文仅用于信息交流目的,不是汇丰银行有限公司(HSBC Bank Plc.)或其附属公司的产品。汇丰银行有限公司及其任何附属公司均不对本文的内容作出任何明示或暗示的保证,也不承担与此文章相关的任何责任,包括但不限于其完整性、准确性和可靠性