通过 Conidfine 解决代码精炼中的歧义:一个具有消歧功能和定向检索能力的、基于对话理解的框架
《Neural Networks》:Resolving Ambiguity in Code Refinement via Conidfine: A Conversationally-Aware Framework with Disambiguation and Targeted Retrieval
【字体:
大
中
小
】
时间:2026年01月31日
来源:Neural Networks 6.3
编辑推荐:
代码细化对话框架通过歧义检测器与多策略检索解决模糊审查建议问题,有效提升代码细化模型性能,并验证了对话数据的关键作用。
本文针对代码审查中存在的模糊性建议问题提出创新解决方案,通过整合开发者与审查者之间的对话信息提升代码优化效果。研究显示17.7%的代码审查建议存在模糊性,主要表现为定位不准确、表达不清或指导缺失,导致自动化工具难以准确执行修改。传统方法依赖静态代码和简短的反馈建议,无法有效利用对话中的上下文信息。本文构建的Conidfine框架包含两个核心模块:首先,基于GPT-4标注数据的模糊性判别器,通过多任务学习同时完成模糊性分类和生成类型化混淆点;其次,采用类型驱动策略的检索框架,根据混淆点类型(如定位错误、表述不清等)自动选择对话中的关键信息。研究通过对比TransReview、T5-Review等5个SOTA模型,在CodeReview和CodeReview-New数据集上验证,使用户平均代码修正准确率提升23.6%,在处理定位错误类模糊建议时效果尤为显著。特别构建的语义辅助指令库包含空间指示词(如"第4-7行")、澄清模板(如"请说明错误类型")和动作导向动词(如"建议添加注释"),使对话信息提取准确率提升至89.4%。人类评估显示,模糊性检测准确率达到92.3%,混淆点生成与真实意图匹配度达85.7%。该研究首次系统性地揭示代码审查对话中的隐性知识价值,为后续研究提供三个基础:1)建立包含16类模糊性的代码审查标注标准;2)提出对话信息分级利用机制(核心对话→关联对话→背景对话);3)设计多粒度对话检索策略(行级定位→函数级逻辑→模块级架构)。实验表明,结合判别器筛选出的关键对话片段可使模型生成代码的审查通过率从68.2%提升至82.5%。研究建议后续工作可深入探索对话信息动态权重分配机制,以及结合代码版本历史对话的上下文建模方法。该成果为提升自动化代码审查质量提供了可复现的技术路径,相关工具链已开源,在GitHub获得320+星标和47个有效PR。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号