今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

OncoPT:用于从病理报告中提取医院内肿瘤表型特征的长上下文变换器模型

《npj Digital Medicine》:OncoPT: long-context transformer models for in hospital tumor phenotype extraction from pathology reports

【字体: 大 中 小 】 时间:2026年05月03日 来源:npj Digital Medicine 15.1

编辑推荐:

  摘要尽管医学信息学领域取得了最新进展,但从病理报告中提取肿瘤信息在现代癌症登记和监测工作中仍面临挑战。这些文档通常具有非结构化格式、复杂的医学内容以及冗长的背景信息,给自动化表型信息提取带来了巨大困难。虽然一些最新的语言模型(如BERT、GatorTron和GPT-4)在医学应用

  

摘要

尽管医学信息学领域取得了最新进展,但从病理报告中提取肿瘤信息在现代癌症登记和监测工作中仍面临挑战。这些文档通常具有非结构化格式、复杂的医学内容以及冗长的背景信息,给自动化表型信息提取带来了巨大困难。虽然一些最新的语言模型(如BERT、GatorTron和GPT-4)在医学应用中表现出色,但它们要么受到序列长度的限制,要么依赖云计算,而这会违反对受保护健康信息的处理规定。我们提出了两种针对肿瘤病理学优化的Transformer模型OncoPT,这些模型基于Longformer和BigBird架构,并通过真实世界的病理报告进行训练。OncoPT能够高效处理多达4,096个标记的病理报告,使其适合资源有限的医院现场部署。我们将OncoPT应用于两种恶性肿瘤(分别以乳腺癌和胃癌为例),并针对五个关键的肿瘤表型进行测试:亚部位、组织学类型、分级、分期和肿瘤侧别。实验结果表明,在私有病理数据集上,OncoPT取得了领先的加权F-1分数;在公共CORAL数据集上,其性能超过了商用聊天机器人(ChatGPT 4o和o1),提升幅度高达30%。这些发现凸显了OncoPT模型的稳健性,同时还能有效保护患者健康信息的隐私。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:OncoPT模型|病理报告信息提取|Transformer架构优化|肿瘤表型自动化|隐私保护医疗AI|性能提升30%

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号