通过扩展专利引用网络并结合LSTM(长短期记忆网络)和GCN(图卷积网络)来识别面向未来的技术机遇

【字体: 时间:2026年03月13日 来源:Expert Systems with Applications 7.5

编辑推荐:

  本文提出结合LSTM和GCN的新方法,通过扩展专利引文网络预测未来技术机会。在电动汽车充电站领域实验表明,该方法有效捕捉时间依赖和拓扑结构,提升预测精度,为技术机会分析提供新视角。

  
刘振峰|向新月|冯健|韩旭
上海海事大学经济与管理学院,中国上海201306

摘要

通过专利引用网络识别技术机会往往只是重新组合现有的碎片化技术元素,可能会忽略文档中的深层语义信息、技术轨迹的时间连续性以及多个技术路径之间的互动性。为了填补这些空白,我们提出了一种新的方法,该方法结合了长短期记忆网络(LSTM)和图卷积网络(GCN),基于过去的技术轨迹来预测面向未来的文本嵌入向量,从而扩展专利引用网络并识别面向未来的技术机会。在电动汽车(EV)充电站领域的实验结果表明,LSTM和GCN的混合模型不仅能够通过学习历史引用信息来预测潜在专利,还能加强多个技术路径之间的互动引用关系。该模型的预测性能经过与其他时间序列基准模型的对比验证,显示出更高的准确性。这项研究通过提供一种新的理论方法来预测潜在专利并识别面向未来的技术机会,为文献做出了贡献。它通过整合专利引用网络中的节点、时间和拓扑结构属性,为技术机会分析提供了新的视角,从而便于学术界和行业技术管理者进行实证操作。

引言

自Dosi(1982年)以来,技术进步通常是一个特定技术沿着既定技术轨迹的连续和累积过程。沿着这一思路,后续学者采用了常见的方法,包括S形生命周期(Coccia和Roshani,2024年;Hou等人,2024年;Pezzoni等人,2022年)、引用网络(Chen和Cho,2024年;Yu和Yan,2022年)以及混合方法(Huang等人,2022年;Smojver等人,2021年),以揭示技术轨迹。在许多数据源中,包含丰富技术信息的专利被证明在描述技术轨迹方面特别有利(Bhatt等人,2023年;Boutillier等人,2023年;Lai等人,2023年)。其他数据源,如标准(Kim、Lee等人,2017年)、期刊文章(Hwang和Shin,2019年)和媒体数据,也被用来丰富技术轨迹。由于S形曲线强调了技术发展的宏观阶段(Su等人,2023年),专利引用网络在微观层面上使学者能够通过专利之间的“知识继承”信息追踪技术生成的轨迹(Huenteler等人,2016年;Sharma和Tripathi,2017年)。学者们分析了带有时间属性的引用网络的动态主路径,并观察到了技术演变的动态变化(Han等人,2023年;Minghan等人,2020年)。此外,他们在识别关键引用路径的过程中整合了其他技术元素,如专利权利要求(Qiu和Wang,2023年)和文本聚类(Zhong等人,2020年)。
由于新的技术机会对于追踪技术轨迹至关重要(Malhotra等人,2021年;Ren等人,2024年),企业和相关行业专家必须投入足够的关注和资源来识别新兴的技术机会。技术机会被定义为一系列技术发展的可能性(Klevorick等人,1995年;Wu等人,2023年),这些可能性与企业和行业的生存和增长密切相关(Papa等人,2020年)。然而,专利引用网络擅长描述过去的技术趋势,但不适合预测未来的技术变化和识别潜在的技术机会。为了克服这些不足,Kim和Lee(2017年)以及Park和Yoon(2018年)分别使用神经网络分析和基于边缘介数中心性的链接预测来预测专利引用网络中的潜在技术知识流,并发现了生物技术和信息技术之间的技术机会。Kim和Lee(2017年)检测了专利引用网络中的边缘异常值,以识别具有高融合潜力的专利对,从而发现技术机会。尽管做出了这些努力,它们本质上仍然是在识别现有专利引用网络中的过去和“旧”技术,而不是真正预测“新”的、面向未来的技术机会。因此,Kim和Shin(2018年)、Hwang和Shin(2019年)以及Yu和Yan(2022年)在现有引用网络的后端添加了新的信号,以实现扩展技术轨迹的目的。尽管这些扩展技术轨迹的方法为研究人员提供了对未来技术方向的洞察,但它们仍然存在几个未解决的问题:
  • 1)
    鉴于技术轨迹代表了随时间累积的知识积累和继承过程,识别出的技术机会不应偏离之前的技术路径。然而,上述扩展方法仅将外部知识与现有引用路径中的当前技术主题关联起来,从而忽略了专利引用随时间的长期依赖性影响,进而忽视了引用网络的时间属性。
  • 2)
    专利引用网络包含多种相互关联的交叉引用,这对于识别未来的技术机会至关重要。现有研究表明,整体技术轨迹可能会随时间在不同子系统之间以顺序模式发生变化(Huenteler等人,2016年)。然而,上述扩展方法仅依赖于主路径分析来沿多个孤立的引用路径进行扩展,从而忽略了多个分支路径之间的互动性和整个引用网络的拓扑结构属性。
  • 为了解决第一个限制,我们将文档嵌入算法(例如Doc2vec)与长短期记忆网络(LSTM)结合使用,LSTM是循环神经网络(RNN)的一种变体,在专利引用网络中向后预测未来的节点(即潜在专利)。LSTM的独特记忆单元和门机制可以有效捕捉专利引用的长期依赖性,从而更好地学习时间属性。尽管LSTM试图从历史引用信息中学习每个技术路径的演变模式,但它只能预测每个时间序列内的孤立引用路径,无法描绘多个分支路径之间的互动性和整个专利引用网络的拓扑结构。因此,我们结合了图卷积网络(GCN)来更好地学习整个网络的拓扑结构属性,通过聚合相邻路径的信息来处理整个专利引用网络中多个路径的互动引用关系,从而解决了第二个问题。鉴于预测的节点是从引用路径上的过去专利信息中得出的特征向量,我们将它们与外部技术数据关联起来以进行实际解释。因此,文档嵌入可以提供对识别出的技术机会的微观层面的细致解释,LSTM和GCN的结合可以在专利引用网络中实现时间和图网络的融合。我们提出的方法论通过扩展专利引用网络,便于学术研究人员和行业技术规划者进行技术机会的实证操作。
    为了实现上述目标,本研究提出了一种通过结合LSTM和GCN扩展专利引用网络来识别技术机会的新方法。首先,我们开发了一个构建专利引用网络的程序。该程序包括收集专利数据、提取专利引用关系、合并专利家族、通过主路径分析获得关键路径,并通过Doc2vec将专利文档转换为向量。其次,我们设计了一个结合LSTM和GCN的统一模型来处理专利引用网络中的时空属性。该模型可以通过LSTM学习时间属性,通过GCN学习网络的拓扑结构属性。LSTM用于向后预测未来节点,以扩展专利引用网络,并为网络内的初始节点嵌入做出贡献。而GCN模型则用于根据整个专利引用网络中多个路径的互动引用关系获得预测节点的最终特征向量。然后,我们通过将预测节点的准确性与其他基线RNN进行比较来验证所提出的LSTM+GCN模型的良好预测性能。最后,我们通过将预测节点与外部最新文档(例如评论和媒体新闻)关联起来来识别和解释技术机会。
    本研究对现有文献做出了两项贡献。主要的学术贡献是通过扩展专利引用网络来预测潜在专利和识别面向未来的技术机会。以往的研究基于现有专利识别关键技术前沿或提出专利建议。然而,很少有文章通过专利引用路径来预测未来技术。本研究将创新信号与当前的专利引用路径联系起来,沿着这些轨迹向后一步预测潜在的专利申请,从而旨在扩展专利引用网络。我们的方法论贡献是开发了一个结合文档嵌入、时间序列预测和图神经网络的模型来扩展专利引用网络。文档嵌入用于编码已知的专利节点,时间序列预测有助于获得预测专利的特征向量,图神经网络加强了多个路径之间的互动引用关系,从而提高了预测准确性。该模型整合了网络中的节点、时间和拓扑结构属性,从而为通过扩展专利引用网络进行技术机会分析提供了新的视角。
    本文的其余部分组织如下。第2节介绍相关文献。第3节描述了研究框架和提出的方法,并在第4节通过案例研究进行了说明。第5节从理论和实践角度讨论了研究意义。

    章节片段

    专利引用网络

    分析和监控技术的当前和历史状态被认为是企业获得竞争优势和识别有前景的市场细分的关键资产(Choi和Park,2009年)。在所有数据源中,专利已被证明为研发人员提供了最科学和技术性的信息(Liu等人,2023年)。专利中隐藏了许多可用于构建网络的技术元素,经验丰富的研发人员可以理解这些技术

    研究框架和方法

    在本节中,我们首先展示了整体研究框架,如图1所示,然后描述了可以应用于通过扩展专利引用网络来识别面向未来技术机会的方法设计。该框架分为以下三个阶段。阶段Ⅰ:构建专利引用网络。在此阶段,我们收集专利文档并从专利数据库中提取引用关系以构建专利引用网络。阶段Ⅱ

    案例研究和实验结果

    在本研究中,我们选择了电动汽车(EV)领域的充电站技术进行实证研究,以验证所提出方法的有效性。随着EV行业的发展,充电站技术近年来也受到了关注(Feng等人,2024年;Liu等人,2024年;Liu等人,2024年)。识别EV充电站领域的技术机会有助于促进整个行业的创新和提升

    实际验证

    我们验证了关键路径上的最后一个节点。我们将它们视为网络中的最后一个节点。根据网络的拓扑结构和过去节点的特征向量,我们预测其特征并将其与实际特征向量进行比较。
    我们预测了专利2023C4250Y,并比较了真实专利和预测结果的信息。因此,我们重建了摘要数据集和边数据。新的网络不包括专利2023C4250Y,由剩余的186个节点组成

    意义

    在本研究中,我们提出了一种通过扩展专利引用网络来识别面向未来技术机会的新方法。我们通过结合时间序列预测和图神经网络模型,在专利引用网络的后端预测专利节点。随后,我们根据数据空间中与预测专利相邻的节点所代表的外部技术文档来识别技术机会。因此,这项技术

    CRediT作者贡献声明

    刘振峰:概念化、方法论、项目管理、写作——审阅与编辑。向新月:方法论、写作——初稿。冯健:形式分析、资源、写作——审阅与编辑。韩旭:写作——审阅与编辑。

    利益冲突声明

    作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

    致谢

    作者衷心感谢中国社会科学基金(项目编号24BGL104)的支持。作者还感谢Contrimetrics团队的技术协助。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号