《Scientific Data》:BDSet: A First-ever BDS Satellite-based PPP Augmentation Dataset Since 2023
编辑推荐:
北斗三号系统通过PPP-B2b信号提供精密单点定位(PPP)增强服务,但目前缺乏公开的长期基准数据集。为此,研究人员构建了全球首套始于2023年的BDS PPP-B2b增强数据集BDSet。该数据集包含从原始数据到最终产品的完整流程,数据量超142 GB,涵盖超2.5亿条增强信息,为GNSS PNT、地球科学及AI大数据挖掘提供了宝贵资源。
在卫星导航的世界里,精度就是一切。无论是自动驾驶汽车的精确定位,还是地震监测的毫米级形变捕捉,都离不开被称为“精密单点定位(Precise Point Positioning, PPP)”的技术。它能让普通的单台接收机获得厘米甚至毫米级的定位精度,而无需依赖地面基站网络。中国的北斗三号全球卫星导航系统(BDS-3)推出了一项革命性的服务——PPP-B2b,它通过地球静止轨道卫星向亚太区域广播精密改正数,让用户能实时获得高精度定位能力。这听起来很美好,但有一个问题横亘在研究者面前:自2020年正式服务以来,虽然PPP-B2b信号一直在空中传播,却一直没有一套长期、连续、标准化的公开数据集可供科研社区使用。没有数据,就像巧妇难为无米之炊,许多深入的研究,比如信号质量分析、改正数产品评估、新算法验证,特别是近年来火热的人工智能(AI)大数据挖掘,都难以系统性地开展。研究人员只能各自为战,数据格式不一,时间跨度有限,这严重制约了PPP-B2b服务潜能的最大化。
为了打破这一僵局,一项开创性的工作应运而生,并将其成果以数据论文的形式发表在了《Scientific Data》期刊上。这项研究构建并发布了全球首套BDS PPP-B2b增强数据集,命名为“BDSet”。该数据集自2023年1月1日起开始构建并持续更新,旨在为全球导航卫星系统(Global Navigation Satellite System, GNSS)的定位、导航与授时(Positioning, Navigation and Timing, PNT)、地球科学、气象学等多个领域,以及未来的AI赋能型北斗大数据挖掘,提供一个坚实、统一的数据基础。
为了构建这套数据集,研究人员在中国武汉设立了一个固定的数据采集站,持续接收来自北斗三号PPP-B2b增强信号。整个数据处理流程被设计为一个清晰的四级流水线:“原始数据→标准化数据→解码数据→最终产品”。首先,从接收机芯片中获取原始的PPP-B2b增强信号数据流;接着,将这些原始数据流解析并打包成符合标准格式的PPP-B2b增强电文;然后,对标准电文进行解码,提取出其中的状态空间表示(State Space Representation, SSR)改正数,这些改正数包含了卫星轨道、钟差等精密误差信息;最后,利用解码出的SSR改正数,结合卫星广播星历,恢复出可以直接用于各类PNT应用的精密产品,如精密卫星轨道和钟差。这种方法确保了数据从信号接收到最终可用的全链条可追溯性与一致性。
主要技术方法:本研究在武汉建立固定监测站,持续采集BDS PPP-B2b信号。核心技术流程包括四个步骤:1)从接收芯片获取原始信号数据流;2)将原始流解析为标准化的PPP-B2b增强电文;3)解码电文,提取其中的状态空间表示(SSR)轨道、钟差等改正数;4)结合广播星历,将SSR改正数恢复为可直接用于定位、导航、授时(PNT)的精密轨道与钟差产品,形成一套完整的“原始-标准化-解码-产品”数据集。
数据集规模与内容。研究生成的BDSet数据集体量庞大。仅2023年至2025年三年的数据,就占据了142.7 GB的存储空间,其中包含了高达255,405,156条PPP-B2b增强电文。这些海量数据为长期统计分析提供了可能。研究人员进一步分析了这些电文在不同卫星间的分布。数据显示,来自BDS卫星C59、C60、C61和C62的电文数量分别为87,080,707条、80,148,878条、13,107,885条和75,067,686条。这一分布情况反映了不同卫星在PPP-B2b信号播发中的实际活跃度和数据贡献,为研究信号特性与卫星状态的关联提供了基础。
数据集的可用性与价值。BDSet并非一个静态的快照,而是一个持续生长的动态数据库。它自2023年1月1日起开始构建,并承诺将持续更新。这种持续性对于研究信号长期性能演变、分析空间环境对信号的影响至关重要。更重要的是,该数据集完整覆盖了从信号接收到最终应用产品的全链条数据。这意味着研究者不仅可以评估最终定位结果的精度,还能深入中间任何一个环节进行分析,例如研究原始信号的强度与质量、分析电文结构的合规性与稳定性、评估SSR改正数的精度与时效性。这为多角度、深层次地挖掘PPP-B2b服务的价值打开了大门。
研究结论与意义。综上所述,本研究成功创建并发布了首个自2023年起连续更新的BDS PPP-B2b增强数据集——BDSet。它系统地提供了从原始信号到最终可用产品的全流程数据,数据量超142GB,包含超2.5亿条增强电文。这项工作的重要意义是多方面的。首先,在工程与应用层面,BDSet为学术界和工业界评估和提升PPP-B2b服务性能提供了一个权威、统一的基准,能促进更高效的PPP算法开发和终端设备研发。其次,在科学探索层面,丰富的数据将为地球物理学、大气科学等领域的研究提供新的数据源,例如可用于反演大气水汽含量或监测电离层扰动。最后,也是面向未来最关键的一点,这套跨越三年的海量时序数据集,为运用人工智能(AI)和大数据技术挖掘北斗导航系统的深层规律、实现故障预测、性能优化和智能服务提供了前所未有的“燃料”。BDSet的发布,标志着BDS PPP-B2b服务从“可用”到“可深度研究”迈出了关键一步,必将激发全球在该领域的创新研究浪潮。