ICML 2025 | 上海交通大学×上海创智学院×复旦大学联合出品
时序数据分析在工业监控、医疗诊断等领域至关重要。然而,现有研究多聚焦于分类、预测等单一任务,与实际工业场景中专家通过自然语言进行复杂交互和决策的需求存在显著差异。上海交通大学航空航天学院李元祥教授团队以航空发动机运维为背景,首次系统性地提出并解决了复杂时序问答(Time-Series QA)问题,为时序数据建模和应用提供了新的思路。
在航空发动机监控等复杂工业场景中,工程师需分析海量多通道传感器数据,以判断设备状态并制定维护决策。传统方法依赖专家经验,效率有限且难以处理大规模数据。更重要的是,知识的传递与协同主要依靠自然语言,而现有分析工具普遍缺乏与语言的有效交互能力。
ITFormer的设计思想是作为一个轻量级的”桥梁”,在冻结预训练时序编码器和大型语言模型(LLM)的前提下,实现两者的高效对齐与融合。
为精确表征多维时序数据的结构,TPE在三个层次上进行位置编码:时间步(Temporal Steps)、通道(Channels)和时序片段(Segments),确保模型能区分不同时间点、不同传感器以及不同数据段的语义信息。
为了让模型理解具体的任务指令,LIT在文本查询前添加了一组可学习的令牌。这些令牌通过自注意力机制,能够从自然语言查询中自动捕获并浓缩任务相关的语义信息,从而指导后续的跨模态融合。
作为ITFormer的核心创新,ITA通过一个高效的两阶段过程实现跨模态对齐: 1. 通道指令融合(Channel Instruct Fusing):根据LIT提供的任务指令,动态地对每个时间步上的多通道特征进行加权聚合,筛选出与任务最相关的传感器信息。 2. 时间指令注意力(Time Instruct Attention):在上一步的基础上,再次根据任务指令,在时间维度上进行注意力加权,聚合最关键的时间片段信息。
这一设计显著提升了计算效率,同时保证了对齐的精确性。
该策略将ITA融合后的时序特征向量直接视为语言令牌,并替换掉文本查询中预设的占位符。这使得时序信息能以一种与语言模型兼容的方式,无缝嵌入到LLM的输入序列中,从而实现端到端的建模。
EngineMT-QA基于真实的工业应用场景设计,其任务层次反映了专家处理时序数据的认知过程。
任务类型 | 认知层次 | 典型场景 | 查询示例 |
理解 | 基础感知 | 信号模式解释 | “燃油流量变化趋势说明了什么?” |
感知 | 状态评估 | 设备健康判断 | “低压压气机是否存在异常?” |
推理 | 趋势预测 | 前瞻性分析 | “未来5个周期故障概率如何?” |
决策 | 行动规划 | 维护策略制定 | “应该预防性维护还是继续监控?” |
Task Sample
在EngineMT-QA数据集上,ITFormer的性能全面超越了包括主流多模态API(ChatGPT-4o, Gemini)和专用时序-文本模型(Time-LLM, AutoTime)在内的所有基线。尤其在需要深度分析的”推理”和”决策”任务上,F1分数和BLEU得分的显著领先,证明了ITFormer对复杂时序-语言关系具备强大的建模能力。
ITFormer展现了卓越的”即插即用”特性。实验证明,它可无缝适配PatchTST、Informer、Crossformer等多种时序编码器,以及Qwen、LLaMA、GLM等不同规模和架构的大语言模型。此外,随着底层语言模型规模的提升,整体任务性能也随之稳步提高,表现出良好的可扩展性。
为验证模型与数据集的通用价值,研究团队在公开基准TimeSeriesExam上进行了测试。结果显示: 1. ITFormer方法的有效性:即便不经过预训练,ITFormer直接在TimeSeriesExam上训练,其性能已在多个任务上优于通用基线,证明了其架构设计的先进性。 2. EngineMT-QA数据集的价值:在使用EngineMT-QA进行预训练后,ITFormer的性能得到进一步的巨大提升,在全部五项任务上均达到SOTA水平,其中”因果分析”准确率高达0.83。
这充分说明,EngineMT-QA作为一个时序文本对数据集,能够为模型提供关于时序-文本关系的本质性知识,从而显著提升其在其他任务上的泛化能力。
本研究首次系统性地提出了复杂时序问答任务,并结合工业场景构建了大规模数据集,设计了高效、可迁移的ITFormer架构。实验结果充分验证了该框架在准确率、泛化能力和推理效率上的综合优势。
时序问答(Time-Series QA)这一新范式为时序分析领域带来了两个核心价值:
ITFormer及EngineMT-QA为时序AI社区提供了新的研究范式和宝贵资源,在工程和科学领域均具有广阔的应用前景。
上海交通大学航空航天学院、上海创智学院、复旦大学数据科学学院
这项研究不仅是时序分析领域的一次重要技术突破,更重要的是,它为时序AI研究社区提供了一个全新的视角。时序问答(Time-Series QA)这一范式有望从根本上改变我们与时序数据交互的方式:
1. 在输入端,让知识融合更自然
传统的时序模型只能处理纯数值输入,无法利用人类的先验知识。而时序问答范式允许用户通过自然语言,将丰富的外部知识和上下文信息注入到分析过程中。
例如,工程师可以告诉模型:“忽略下午3点到3点10分的数据,期间在进行设备校准”,或者”重点关注振动和温度传感器的关联性,我们怀疑是轴承问题”。这种灵活的知识注入方式,能够显著提升模型在复杂场景下的分析精度和鲁棒性。
2. 在输出端,让数据分析更普及
时序问答将复杂的模型输出转化为可理解的自然语言,极大地降低了时序数据分析的使用门槛。它使得非数据科学专家(如生产线经理、设备维护人员)也能通过对话的方式,与时序数据进行深度交互。
用户可以进行追问式探索:“昨天哪个设备的能耗最高?” -> “为什么它的能耗这么高?” -> “和上周同期相比情况如何?”。这种交互式的分析流程,让数据探索过程更符合人类的思维习惯,从而真正实现了数据分析的”平民化”。
ITFormer及其背后的时序问答范式,不仅仅是解决了一个具体的工业问题,更是为整个时序AI领域的发展,提供了一套富有想象力和实用价值的全新解决方案。
版权所有 上海交通大学空天智能光电技术实验室