航空运维-1 旋转机械故障诊断与预测大模型 RmGPT-1
问题:在实际工业生产场景中,高价值设备结构种类繁多、构型差异大、故障机理多样;传感器数目、安装位置、采样频率差异大,很难用一个通用模型进行诊断和预测性维护
难点:1)设备种类繁多、构型差异大、故障机理多样
2)传感器数目、安装位置、采样频率差异大
突破:提出一种能够针对少样本、跨设备、跨工况、跨通道、跨频率任意旋转机械的通用诊断大模型Rotating Machinery Generative Pre-Trained(RmGPT)
通用诊断预测框架
将PHM任务统一到一个生成框架下,即所有任务基于模型生成的语义向量(token)完成
通用token框架
利用前置token学习各个设备特点,中间token学习归一化信号特征,末尾token作为下游任务基础
通用建模能力
一个模型在所有数据集上超过各个模型单独训练结果
强大少样本能力
每个类别仅一个样本训练,实现92%的16类分类能力,远超其他方法
旋转机械故障诊断与预测大模型 RmGPT-2:
问题:在实际工业生产场景中,高价值设备结构种类繁多、构型差异大、故障机理多样;传感器数目、安装位置、采样频率差异大,很难用一个通用模型进行诊断和预测性维护,且故障样本稀疏。
难点:1)设备种类繁多、构型差异大、故障机理多样
2)故障样本少,稀疏,零样本诊断困难
突破:基于对比学习,提出一种多层次、多尺度自蒸馏自监督学习技术实现稳定领域泛化、跨设备零样本诊断第二代通用诊断大模型RmGPT-2
数据知识融合的长时序信号自监督表征学习:
航空运维-2 工况自适应的时频域增强虚拟传感器
问题:飞机运营过程中的传感器数目(3k+)远远小于试飞过程中的传感器数量(3w+),传感器缺失带来的信息缺失,给运营过程中的健康趋势监控、排故流程带来巨大困难。
难点:1)试飞数据存在大量噪声
2)飞行工况多,传感器之间的关系复杂
3)模型参数需要随工况动态变化
突破:针对飞机空调pack系统,提出多专家网络(MoE)自适应学习多工况情景下的不同传感器间关系,提出时频增强损失提升模型学习能力。
优点:
自适应工况预测能力:设置已知工况数目的专家头,自适应学习飞机各个飞行工况下的传感器关系
时频增强学习:提出在频域增强传感器预测目标,利用频域中基函数的正交性减少传感器波动对学习带来的影响
高精度传感器建模:实现相对精度5%,精准定位飞机故障
航空运维-3 引气系统超压健康指数构建
问题:在飞机运维过程中,引气系统时长出现超压与低压报警;对航班运维效率产生影响。需要利用数据驱动的技术手段分析引气系统的运维数据,得到引气系统的健康指数。从而对引气系统的健康状态进行趋势分析与监控,以提前进行维护,降低运维成本,提升运维效率。
难点:引气系统积累的运维数据存在着:数据维度高、正常样本多、故障样本少且人工标签成本高等特点
突破:为避免高成本的人工标记,使用自监督范式的数据驱动方法研究本问题;同时使用基于树结构的 LightGBM 模型实现对高维数据的高效分析
优点:
(1)从工业界大量无标签的数据中学习引气系统正常状态
(2)根据压力偏差值对系统状态健康状态进行评估,作为预测性维护决策基础
航空运维-4 跨机型气源系统诊断与预测大模型BasGPT
问题: 不同以机型的部件有着相似的类似的物理机理、设计逻辑甚至信号特点但却因构型的不同,有着不同的信号表现以及异常原因,不同机型的知识难以共享
难点:1)不同构型飞参信号特点差距大
2)不同构型气源系统异常原因不同
突破:提出BasGPT,使用一个统一的框架和模型构建跨机型的气源系统故障诊断预测大模型
优点:
通用建模能力:一个模型在所有数据集上超过各个模型单独训练结果
检测基线联合损失:针对运营过程中异常数据少、正常数据特点提出联合损失,实现对系统动态的精准建模,以及可解释的异常检测
跨机型知识迁移:从成熟的A320、A330积累的海量飞参中挖掘知识,并迁移支援到新机型C919上,提升模型精度
准确率,F1 score等指标都超越当前先进时序预测方法 健康指数 异常检测概率输出
航空运维-5 多模态多任务发动机信号问答
问题:如何在复杂的多任务、多层次场景下,构建能够融合时间序列与自然语言的统一框架,以支持自然语言交互中的问答、推理和决策,同时弥补现有方法在处理多模态信息、高效推理能力和适应复杂场景等方面的不足?
难点:缺乏支持时间序列与自然语言融合任务的公开数据集,现有时间序列分析框架在自然语言交互和多模态信息处理能力方面存在明显不足,尤其是在结合文本问题进行高效推理和决策时表现有限,同时研究范式尚未成熟,难以有效推动信号处理与自然语言理解的深度融合。
突破:提出了新型框架 ITFormer(InstructTime Transformer),首次定义 Time-Series QA 这一新任务,探索从时间序列信号中回答自然语言问题的可能性。通过构建多模态问答数据集 EngineMT-QA,ITFormer实现了时间序列与文本语义的深度对齐与融合,克服了现有时间序列分析框架在自然语言交互中的局限性。在多任务场景下,ITFormer显著提升了时序感知、推理和决策的性能,展示了跨模态统一表示的优越性,为时间序列与自然语言交互的研究开辟了新的方向。
首个多任务时序文本QA数据集:构建并开源了首个大规模时间序列多模态问答数据集 EngineMT-QA,基于航空发动机运行数据生成,涵盖 110k 对问答对,覆盖 时序理解、感知、推理和决策 四大任务场景,填补了多模态时间序列任务的研究空白。
性能优势:根据不同领域的方法构建了强基线benchmark,ITFormer在四个任务中相比其他强基线方法取得了持续且显著的提升。
广泛的适应性:ITFormer将不同的LLM(如Qwen、Llama、GLM等系列模型)与多种时间序列编码器结构进行有效桥接,能够实现稳定的时序问答(QA)性能,展示了其对不同模型和方法的良好适应性。
高效模态间交互计算:所提出的ITA、TPE、TAL以及LIT组件均对性能产生了稳定的提升。其中,ITA注意力机制在多通道和长输入情况下,显著加速了时间序列信号的处理;而LIT提示机制则在长文本指令场景下,表现出较大的加速效果。
航空运维-6 面向真实BMS数据的锂电池容量估计
问题:电动汽车(EV)电池的容量预测和循环利用的优化对推动电动交通的可持续性至关重要。现有模型难以准确捕捉EV电池容量的实际衰退模式,主要由于真实数据不足和电池管理系统(BMS)动态的复杂性。
难点:BMS数据维度高,样本间存在较大差异,尤其是由于实际使用场景的多变性导致的非线性特性,增加了预测的难度。
突破:本文提出了新型框架Nevformer,通过自监督学习在高维度BMS数据中提取电池健康信息,克服了人工特征工程的局限性。利用真实数据,Nevformer模型在预测性能上优于现有方法,并提出基于预测的循环策略,可提升40%的经济效益,增加电池生命周期内的收益。
深入分析百万维BMS数据 NevFormer框架
优点:
真实大规模数据集:采集并公开了21辆相同型号电动汽车一年运营的真实数据集,为实际电池管理研究提供了基准数据。
自监督学习新方法:提出了Nevformer深度学习框架,通过自监督学习自动从高维度电池管理系统(BMS)数据中提取有效模式,减少人工特征工程的需求。
领先的预测精度:在不同预测时长中,Nevformer模型实现了41%到85%的RMSE降低,超越现有预测方法。
经济与环境效益:基于模型预测提出循环利用策略,每辆车经济收益增加20万元人民币,推动了可持续出行的发展。
航空运维-7 飞机关键系统预测性维修平台
新平台包括:
起落架、前轮转弯、液压、氧气、燃油、发动机、飞控、蒙皮活门、空调、引气等多个系统,通过对QAR数据的分析,实现包括机队管理、状态监控、告警管理、趋势分析等多种功能
告警展示页面:
通过飞机视角和事件视角对自定义的警告进行展示,涉及燃油,起落架,前轮转弯,液压,蒙皮活门,空调,引气,氧气,飞控等系统,后期可以按需增加监控逻辑。
航空运维-8 民机智能诊断运营大脑
针对民机PHM面临可解释性差、数据异构、数据与专家知识难以融合等挑战,研究:1)多源故障知识图谱融合,2)故障图谱的知识不完备推理及长路径排故推理。通过图表示学习实现故障诊断中的异构数据融合、复杂故障推理、故障快速定位,使得诊断过程高效、具有可解释性;某型民机空调系统故障路径推理能力提升50%以上。联合中国商飞客服公司研制的“智能诊断运营大脑”,与当今热门的大语言模型LLM结合,提高航空公司飞机运维故障信息查询与维修决策的实用性。已在商飞客服公司的业务系统中试运行,可方便进行故障信息检索与智能问答。
版权所有 上海交通大学空天智能光电技术实验室