
-
生物通官微
陪你抓住生命科技
跳动的脉搏
在交互式多模态通信中,利用结构化任务关系提升组合式大型语言模型(LLM)的推理能力
《IEEE Journal on Selected Areas in Communications》:Advancing Compositional LLM Reasoning With Structured Task Relations in Interactive Multimodal Communications
【字体: 大 中 小 】 时间:2026年01月30日 来源:IEEE Journal on Selected Areas in Communications 17.2
编辑推荐:
交互式多模态应用(IMAs)通过整合无线网络中的多种数据形式提升用户体验,传统方法依赖多个独立LLMs处理不同业务流程。本文提出单复合LLM框架,通过ContextLoRA构建任务依赖图指导参数矩阵分区,并设计ContextGear调度策略优化训练流程,有效解决多目标适应和移动端资源约束问题,实验和原型验证均显示优越性。
多模态应用程序(IMAs)[1],例如在车联网[2]、[3]、[4]、[5]中的路线规划,以及在智慧城市中的异常检测,通过利用无线网络上的跨模态数据扩展了智能通信的领域。IMAs在第六代通信(6G)[6]、[7]、[8]中也具有巨大潜力,促进了6G应用场景的发展,如沉浸式通信以及国际电信联盟(ITU)所强调的人工智能与通信[9]、[10]、[11]、[12]。图1展示了三种IMAs的场景,包括车联网(IoV)[5]、[13]、[14]、智能工厂(IF)[15]、[16]和智慧城市(SC)[17]。例如,在智能工厂中,用户可以远程与机器人交互以执行操作,如移动箱子和管理装配线,而机器人也可以通过无线网络进行协作。这些模型使用多种多模态输入(如语音、文本和视觉线索)在交互过程中为用户和设备做出智能决策。早期的研究[18]、[19]、[20]、[21]、[22]主要依赖强化学习来辅助自动化这一过程。这些方法的关键问题在于特定模型在各种任务中的泛化能力。
通过无线网络实现的交互式多模态应用程序(IMAs),如车联网、智能工厂和智慧城市。用户使用多种多模态输入(如语音、文本和图像)与IMAs交互,而IMAs根据请求生成智能决策。
生物通微信公众号
知名企业招聘