基于SABR模型的多任务高斯过程:一种从合成数据到真实数据的框架,用于构建隐含波动率曲线
《Journal of Computational Science》:SABR-informed multitask Gaussian process: A synthetic-to-real framework for implied volatility surface construction
【字体:
大
中
小
】
时间:2026年02月25日
来源:Journal of Computational Science 3.7
编辑推荐:
隐含波动率曲面构建方法融合SABR结构与多任务高斯过程,利用合成数据与市场稀疏观测的联合优化,通过分层正则化平衡跨任务依赖,在近端到期和稀疏区域显著优于单任务高斯过程及SABR模型,同时满足无套利约束,为风险管理提供可靠曲面。
Jirong Zhuang | Xuan Wu
澳门大学数学系,中国澳门特别行政区塔ipa大学大道999078
摘要
本研究介绍了一种基于SABR(Stochastic Arbitrage Pricing Model)的多任务高斯过程方法,用于从稀疏的期权报价中构建隐含波动率曲面。我们将通过校准的SABR模型生成的密集合成数据集视为源任务,将市场期权报价视为目标任务。在多任务高斯过程框架内,我们利用具有层次正则化的任务嵌入来学习跨任务依赖性,从而实现结构信息的自适应传输。在十个市场环境下使用Heston模型进行验证,并以SPX期权为例进行案例研究,该模型在短期到期日上的误差低于单任务高斯过程和SABR模型,在长期到期日上也具有竞争力,同时满足标准无套利条件。该框架结合了理论驱动的结构与非参数贝叶斯回归,为风险管理提供了可靠的隐含波动率曲面。
引言
从稀疏期权报价中构建隐含波动率曲面(IVS)是实际应用中的标准任务。交易部门利用该曲面来支持不同执行价格和到期日的普通期权的波动率报价及日常风险管理。结构团队和模型开发者将其作为下游定价模型校准的输入。当市场流动性有限时,例如在市场开盘时或对于流动性较低的期权产品,以及在远期执行价格和长期到期日等数据稀疏且分布不均的情况下,这项任务尤为具有挑战性。这些操作需求促使人们开发出能够在数据稀疏的情况下保持稳定性的曲面构建方法,并在曲面的翼部产生平滑且无套利的预测结果。
结构模型(如SABR模型[1])因其能够用少量参数捕捉波动率微笑和偏度而受到欢迎。这些模型假设标的资产及其波动率遵循特定的随机微分方程。尽管这些模型提供了合理的插值结果,但它们预先确定的函数形式可能缺乏充分反映市场复杂性的灵活性。相比之下,数据驱动的方法(如高斯过程[2],一种可用于IVS构建的非参数贝叶斯方法[3]、[4])提供了更大的灵活性。然而,这种适应性需要足够的数据支持。在观测数据稀疏的情况下,这些方法容易过拟合,并可能违反无套利条件。
为了解决数据驱动方法中的挑战,最近的研究探讨了如何将先验金融知识融入机器学习方法中。相关文献[5]、[6]、[7]、[8]、[9]、[10]提出了在神经网络或高斯过程中施加来自金融理论的约束的方法。相比之下,Chen等人[11]使用迁移学习方法进行期权定价。他们使用基于Black-Scholes模型生成的合成数据训练神经网络,为后续在实证数据上的微调提供了良好的初始值。
受Chen等人[11]的迁移学习方法的启发,我们提出了基于SABR的多任务高斯过程(SABR-MTGP)。其核心思想是将SABR生成的IVS视为信息源(“源”任务),将市场观测数据视为主要目标任务。然后,我们采用多任务学习框架[12]、[13],在联合优化过程中自适应地学习理论结构(SABR)与实证观测数据之间的关系。在我们的实验中,所提出的SABR-MTGP在数据稀疏的翼部(远期执行价格)方面比单任务高斯过程更为稳定,同时纠正了纯SABR模型可能产生的系统性错误。实施过程包括两个主要阶段:首先,我们使用校准的SABR模型生成合成数据集,该数据集体现了SABR动态的特征;其次,我们同时在这些密集的合成数据和稀疏的市场观测数据上训练多任务高斯过程(MTGP)模型。MTGP框架通过共享的协方差成分学习任务之间的相关性。我们使用具有层次正则化的任务嵌入来适当平衡在从真实市场数据构建IVS时使用SABR的结构指导程度。SABR-MTGP改进了基于稀疏报价的IVS重建效果,但它不能替代基于SABR的动态对冲或场外衍生品估值。我们的研究范围仅限于从稀疏观测数据构建IVS。扩展到对冲和场外衍生品估值需要市场一致的动力学(例如局部或随机局部波动率)以及希腊字母值的验证,这些内容留待未来的工作完成。
隐含波动率曲面的构建可以分为三种互补的方法。首先,结构模型使用可解释的参数来指定能够再现波动率微笑和期限结构的动态,包括SABR[1]、Heston[14]、Variance Gamma[15]和双指数模型[16]。最近,粗糙波动率模型[17]、[18]强调了波动率路径的分数规律性。其次,参数化曲面方法通过SVI[19]、SSVI[20]和基于样条的家族[21]等手段施加形状和无套利结构。第三,机器学习方法(包括高斯过程[3]、[4]、[6]以及神经网络[7]、[8]、[9]、[10]、[22]、[23])提供了数据驱动的替代方案。
与Chen等人[11]的期权迁移学习方法相比,我们的贡献在于通过具有可学习嵌入的任务核以及在层次先验中适应跨任务相关性的方法,将迁移学习应用于高斯过程。
除了隐含波动率曲面的构建外,高斯过程由于其灵活性和量化不确定性的能力,在金融和经济学领域得到了越来越多的应用。大量研究集中在衍生品定价、估值和对冲方面。高斯过程模型已被用于构建金融期限结构[24],加速各种期权的定价和对冲计算[3]、[25]、[26]、[27]、[28],对衍生品投资组合进行CVA计算[29],定价复杂保险产品(如变额年金[30]),以及近似计算对冲所需的希腊字母值[31]。除了直接定价之外,高斯过程模型还作为灵活的工具,用于校准隐含波动率和局部波动率曲面[4]、[6]或衡量投资组合尾部风险[32]。此外,高斯过程模型还应用于更广泛的金融和经济时间序列分析,包括填补缺失的金融数据[33]、预测房地产价格[34]、理解碳市场价格的决定因素[35],以及开发用于宏观经济分析的非参数向量自回归[37]。
本文的其余部分安排如下:第2节介绍隐含波动率曲面的基本概念。第3节详细介绍了所提出方法的细节。第4节描述了数值实验的设置,第5节展示了实验结果。第6节使用真实市场数据展示了所提出方法的应用。
节选内容
背景:隐含波动率曲面
Black-Scholes模型[38]是在特定假设下欧式期权定价的基本框架:标的资产价格遵循几何布朗运动,且资产的波动率是恒定的。实际上,这种恒定波动率的假设与观察到的期权价格不符,后者通常表现出波动率微笑和偏度等特征。为了使Black-Scholes公式与市场价格相符,引入了隐含波动率(IV)的概念。
基于SABR的多任务高斯过程
在本节中,我们描述了如何结合SABR结构和高斯过程的灵活性来构建隐含波动率曲面的方法。
实验设计
为了评估SABR-MTGP与基准方法的性能,我们设计了数值实验。由于目标是评估隐含波动率曲面构建的准确性,我们需要一个能够反映真实市场行为的可靠基准数据。为此,我们选择了Heston随机波动率模型[14],因为它生成的波动率动态与真实市场相似。
我们的实验设置包括生成基准数据、构建稀疏的“市场”观测数据等。
结果与讨论
本节报告了跨市场环境的鲁棒性,并使用基准情景切片进行诊断。我们比较了SABR、单任务高斯过程(GP)、SABR-MTGP、SSVI、三次样条函数和神经网络基线方法的表现。
应用于SPX市场数据
为了评估SABR-MTGP的实际适用性,我们使用OptionMetrics数据库中2023年8月1日的SPX期权数据对其进行了评估。这个案例研究通过在实际市场条件下评估该方法的表现,补充了使用Heston模型的控制实验。
结论
在本文中,我们提出了SABR-MTGP,这是一种结合结构和数据驱动方法来构建隐含波动率曲面的方法。其核心思想是将IVS构建视为一个多任务学习问题,其中我们利用SABR模型的结构信息来改进来自稀疏市场数据的预测。
我们的方法有几个贡献。首先,我们展示了如何将金融模型与机器学习技术相结合。我们在多任务框架中使用了SABR作为补充信息源。
CRediT作者贡献声明
Jirong Zhuang:撰写——审稿与编辑,撰写——初稿,软件开发,方法论。Xuan Wu:撰写——审稿与编辑。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号