论文题目:AIGC for Industrial Time Series: From Deep Generative Models to Large Generative Models(工业时间序列的AIGC:从深层生成模型到大型生成模型)

期刊:IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS: SYSTEMS

摘要:随着ChatGPT等生成模式的显著成功,人工智能生成内容(AIGC)正在经历爆炸性的发展。生成式模型不仅限于文本和图像,还可以生成工业时间序列数据,解决了数据收集和数据注释的困难等挑战。由于其突出的发电能力,它们已被广泛应用于物联网、虚拟现实和网络-物理-社会系统,以提高工业生产的效率。本文综述了工业时间序列的生成模型,从深层生成模型(DGM)到大型生成模型(LGM)。首先,提出了一种基于DGM的工业时间序列生成AIGC框架。在这个框架下,我们考察了先进的工业DGM,并提出了一个多角度的分类。然后,从大规模工业数据集、针对复杂工业特征的LGMS体系结构、工业时间序列的自监督训练、工业下游任务的微调四个方面系统地提出了构建工业LGMS的路线图。此外,我们引入了一个评估基准,系统地评估保真度、多样性和实用性。我们包括一个飞机发动机维修的案例研究,展示了DGM在工业预测性维修中的应用。最后,我们总结了产生式模型在工业中发展所面临的挑战和未来的方向。


从深度生成模型到大型生成模型:工业时序数据的 AIGC 全景综述

摘要速览

ChatGPT、DALL·E 的爆火让人工智能生成内容(AIGC)进入大众视野,但生成模型的价值远不止于文本和图像。这篇综述聚焦于一个更具挑战性的场景——工业时序数据生成,系统梳理了从深度生成模型(DGMs)到大型生成模型(LGMs)的技术演进,并给出了面向工业落地的完整技术路线图。


一、为什么工业时序数据的生成如此重要?

1.1 工业时序数据是工业智能的基石

工业系统每天产生海量时序数据:设备传感器读数、产线运行状态、系统监控指标……这些数据支撑着智能控制、预测性维护、故障诊断等核心应用。然而,"数据够用"在工业场景中几乎是一种奢求

论文指出,工业时序数据的获取面临五大现实困境:

① 标注数据极度稀缺
为复杂工业设备(如航空发动机)收集测试数据成本极高,疲劳测试甚至会损坏设备本身,导致有标注的工业数据集规模普遍偏小。而深度学习的有效训练严重依赖大量标注样本。

② 数据分布严重不均衡
工业系统中,故障与异常事件的发生频率远低于正常运行状态。故障样本的极端稀缺,使深度学习模型难以准确识别和泛化这些"少数类"状态。

③ 传感器数据缺失
传感器故障、网络延迟、数据传输中断等突发情况都会造成时序数据出现空缺,这些缺失值会干扰模型学习并影响预测精度。

④ 工业噪声污染严重
工业环境中的电磁干扰、机械振动等因素会向传感器信号中引入高水平噪声,使时序数据无法准确反映设备的真实运行状态。

⑤ 数据隐私保护需求迫切
传感器采集的时序数据往往包含工业生产流程的敏感信息,企业普遍面临"数据共享"与"隐私保护"之间的两难困境。

核心结论:在工业场景中,通过生成模型合成时序数据,是同时解决上述五大挑战的最有前景的方向。

1.2 现有研究的空白

论文通过与已有综述的对比(见论文 Table I),明确指出了一个关键空白:

Table I — 与已有综述的对比

已有工作或聚焦于计算机视觉领域的扩散模型([45]),或面向通用应用的生成模型([46]),或针对健康信息学([49])等特定领域,没有任何一篇综述同时覆盖时序数据、DGMs、LGMs 和工业应用四个维度。本文正是填补这一空白的工作。


二、工业时序生成的定义与独特挑战

2.1 形式化定义

给定一个包含 N 条、长度为 L 的工业时序集合 T,生成任务的目标是学习其真实分布 $p(s_1, \ldots, s_N)$,进而合成一个统计特性相似的时序集合 $T_{gen}$,使 $q(s_{gen,1}, \ldots, s_{gen,N}) \approx p(s_1, \ldots, s_N)$

2.2 工业时序的三大独特属性

工业时序生成与互联网场景(文本、图像生成)有本质区别,主要体现在以下三点:

  1. 复杂时序依赖:工业系统高度自动化,单变量时序已不足以描述整个工业过程。多变量时序生成要求模型同时捕捉变量间的相关性和时序上的长程依赖,难度远高于单模态数据生成。

  2. 动态过程变异性:工业过程受温度、压力、湿度等环境因素影响,呈现高度动态变化,导致数据偏移和域偏移频繁出现,生成模型必须捕捉这些动态模式。

  3. 极高可靠性要求:工业场景对数据可靠性有严苛标准,生成的时序数据必须真实准确地模拟设备真实运行状态,任何失真都可能导致下游决策失误。


三、主流深度生成模型(DGMs)技术解析

论文系统介绍了四类主流 DGM 架构,下图给出了直观对比:

图2 — 主流DGMs对比图(AR/VAE/GAN/扩散模型的结构与优缺点汇总表)

3.1 自回归模型(AR)

AR 模型基于历史观测值预测未来值。p 阶自回归模型定义为:

$X_t = c + \phi_1 X_{t-1} + \phi_2 X_{t-2} + \cdots + \phi_p X_{t-p} + \epsilon_t$

  • 优势:在序列数据预测上精度高
  • 劣势:难以处理非线性关系
  • 工业应用:时序插补与预测、传感器信号降噪

3.2 变分自编码器(VAE)

VAE 通过概率建模将输入映射到潜在分布,再从中采样生成新样本,损失函数由重构损失和 KL 散度正则项组成:

$\mathcal{L}{VAE}(\phi, \theta) = -\mathbb{E}{q_\phi(z|x)}[\log p_\theta(x|z)] + D_{KL}(q_\phi(z|x) | p(z))$

  • 优势:可量化目标函数,对潜在空间有精细管理
  • 劣势:生成样本清晰度不足
  • 工业应用:工业设备异常检测

3.3 生成对抗网络(GAN)

由 Goodfellow 等人于 2014 年提出,生成器 G 与判别器 D 在零和博弈中相互对抗:

$\min_G \max_D V(D, G) = \mathbb{E}{x \sim p{data}}[\log D(x)] + \mathbb{E}_{z \sim p_z}[\log(1 - D(G(z)))]$

  • 优势:生成样本逼真度极高
  • 劣势:训练不稳定,容易出现模式崩溃
  • 工业应用:工业缺陷检测、故障诊断数据增强

3.4 扩散模型(Diffusion Model)

受物理扩散过程启发,扩散模型通过前向加噪与逆向去噪两阶段 Markov 过程建模数据分布:

前向过程(加噪)$x_t = \sqrt{1 - \beta_t} x_{t-1} + \sqrt{\beta_t} \epsilon_t, \quad \epsilon_t \sim \mathcal{N}(0, I)$

DDPM 损失函数$\mathcal{L}(\theta) = \mathbb{E}{x_t \sim p(x_t), \epsilon_t \sim \mathcal{N}(0,I)}[-\log q\theta(x_{t-1}|x_t)]$

  • 优势:高维数据建模能力强、生成多样性好
  • 劣势:推理时间较长
  • 工业应用:传感器数据插补、工业时序生成(本文重点)

四、DGM-based AIGC 框架:工业时序生成的统一范式

论文提出的核心框架分为三个层次:

图3 — DGM-based AIGC 框架图(三层结构:学习表示→生成任务→工业应用)

第一层:学习表示
生成模型(VAE/GAN/扩散模型)通过建模工业时序的动态过程和变量间相关性,学习其潜在表示。

第二层:五类生成任务
在学到的表示基础上,执行面向工业需求的五类核心生成任务:

生成任务 核心目标 典型方法
限量样本增强 扩充稀缺数据集 MSGAN, Diff-MTS, DiffUCD
不均衡数据合成 平衡类别分布 DRL-GAN, PSDM, VAE-based
传感器信号插补 填充缺失值 DiffAD, IM-GAN, FedTMI
传感器信号降噪 去除噪声干扰 UKF-CycleGAN, Att-DCDN
隐私保护 合成不含敏感信息的数据 DPDM, Fed-LSGAN

第三层:工业落地应用
生成的合成数据最终服务于:异常检测、预测性维护、故障诊断、生产调度优化、供应链管理等。


五、工业 DGM 文献多视角分类(含107篇文献)

论文从生成任务 × 应用场景 × 模型架构三个维度对现有文献进行了系统归类,这是本文最重要的贡献之一:

Table II — 工业时序DGMs多视角分类表(覆盖2019-2025年的主要工作)

从这张表可以读出几个关键趋势:

  1. GAN 仍是主流,但扩散模型正在快速崛起,2023年后扩散模型在故障诊断、预测维护领域的论文数量明显增加
  2. 故障诊断 是研究最密集的应用场景,涵盖 GAN、VAE、扩散模型三类架构的多种方法
  3. 扩散模型 在限量样本增强和不均衡数据合成两类任务上表现出对 GAN 的明显优势

六、从 DGM 到 LGM:工业大生成模型的构建路线图

这是本文最具前瞻性的部分。论文指出,现有 DGMs 面临三大瓶颈:泛化能力有限(只能处理训练分布内的场景)、单任务局限(一个模型对应一个任务)、认知能力不足(难以理解工业数据的深层含义)。

参考 ChatGPT、GPT-4、DALL·E 等 LGMs 的成功经验,论文提出了构建工业大生成模型的四步路线图:

图4 — DGM到LGM路线图(4个关键技术模块的流程图)

6.1 大规模工业数据集

大规模、高质量的工业数据集是 LGM 的基础。现有开源工业数据集包括:

  • CWRU 轴承数据集:包含内环、外环、滚动体等4种故障模式,不同转速和载荷下的振动数据
  • CMAPSS 涡扇发动机数据集:6种工况、2种故障状态下的发动机退化监测数据(本文案例研究即使用此数据集)
  • 此外还有风机数据集、三相电机数据集、齿轮箱数据集等

由于工业数据的特殊性(多源传感器、异构设备信息),需要设计针对工业数据特点的自监督表示学习方法。

6.2 面向复杂工业特性的 LGM 架构

当前最具代表性的 LGM 架构:

  • GPT-4:以 Transformer 为核心,擅长序列建模,可并行处理时序数据
  • DALL·E:以扩散模型为核心,擅长概率分布建模

针对工业时序的 LGM 架构需要在以下方向重点突破:

  • 自适应注意力机制:动态调整注意力权重,同时捕捉时间依赖(近期趋势)和空间依赖(多传感器相关性)
  • 领域专用嵌入:使用 patch embedding 将时序分段,适应不规则时间间隔
  • 频域变换:引入 FFT、小波变换等方法突显时域难以察觉的周期性模式

6.3 工业时序的自监督训练

自监督学习允许模型从无标注数据中学习内在特征,这对工业场景至关重要(大量工业数据无法获得标注)。

面临的核心挑战是处理异构设备信息(温度、压力、流量等不同类型传感器数据)并将其整合为统一表示。迁移学习和领域自适应方法是解决多源异构信息的有效途径。

6.4 工业下游任务的微调

针对工业多任务场景,论文总结了三类主流微调策略:

  1. 任务导向微调:在预训练模型基础上,用任务特定数据进一步训练(调整参数、添加层或修改损失函数)
  2. Prompt 学习微调:设计适配上游预训练任务的模板,以最少标注数据激发预训练模型的潜力
  3. Adapter 网络微调:在预训练模型中插入轻量级 Adapter 网络,学习任务特定表示,同时保留原有知识

七、评估基准:如何科学衡量工业时序生成质量?

论文构建了涵盖四个维度的完整评估体系:

7.1 保真度(Fidelity)——生成数据有多真实?

基于模型的方法:

  • 判别分数(DS):训练 LSTM 分类器区分真实/生成时序,分类误差反映生成质量,越低越好
  • 预测分数(PS):在生成时序上训练预测模型,在真实数据上测试,评估时序动态规律的保留程度
  • 上下文FID(C-FID):将图像领域的 FID 推广到时序,计算特征分布的 Fréchet 距离

基于特征的方法:

  • 边际分布差异(MDD):比较原始与生成时序的直方图差异
  • 相关分数(CS):衡量时序依赖关系的保留程度

基于距离的方法:

  • 欧氏距离(ED):逐点均值欧氏距离
  • 动态时间规整(DTW):捕捉异步时序模式相似度,对时间偏移鲁棒

7.2 多样性(Diversity)——生成数据有多丰富?

  • t-SNE / PCA 可视化:将高维时序降维到2D空间,直观比较生成数据与真实数据的分布覆盖
  • 分布图分析:核密度估计,验证均值、方差等统计量的对齐程度

7.3 实用性(Utility)——生成数据在实际任务中有多大价值?

  • 预测性能(PS):即保真度评估中的PS,同时反映数据的下游支撑能力
  • 下游任务验证:采用"合成+真实数据训练、真实数据测试(TSRTR)"范式,直接验证生成数据的实用价值

7.4 计算效率

记录从模型初始化到收敛的实际运行时间,特别关注大规模数据场景下的可扩展性。


八、案例研究:扩散模型在航空发动机预测维护中的完整验证

8.1 实验设置

  • 数据集:CMAPSS 涡扇发动机数据集(FD001–FD004 四个子集,包含不同工况和故障状态的传感器时序数据)
  • 生成模型:Diff-MTS(论文作者团队提出的条件扩散模型)
  • 对比方法:DiffWave(扩散模型)、GAN-LSTM(GAN)、SMOTE(传统过采样)
  • 评估指标:判别分数(保真度)、PCA/t-SNE 可视化(多样性)、RMSE 和 MAE(下游预测维护任务)

图5 — 扩散模型工作流程图(三阶段:训练→推理→评估与应用)

8.2 实验工作流程

第一阶段:训练(学习工业时序表示)
原始发动机传感器数据经预处理(归一化、清洗)后,通过前向扩散过程逐步加入高斯噪声: $q(x_t | x_{t-1}) = \mathcal{N}(x_t;, \sqrt{1 - \beta_t}, x_{t-1},, \beta_t I)$ 模型(U-Net架构)通过学习逆向去噪过程来重建原始数据,优化目标是最小化预测噪声与真实噪声之差。

第二阶段:推理(有限样本增强)
训练完成的模型从随机高斯噪声出发,通过迭代去噪生成合成传感器数据: $x_{t-1} = \mu_\theta(x_t, t) + \sigma_t z, \quad z \sim \mathcal{N}(0, I)$

第三阶段:评估与工业应用
生成数据经质量评估后,用于增强预测维护模型的训练集,评估其对 RUL 预测精度的改善效果。

8.3 结果一:保真度对比

图6 — 各生成方法在四个数据集上的判别分数对比柱状图

Diff-MTS 在四个数据集上的判别分数(越低越好):

数据集 Diff-MTS DiffWave GAN-LSTM SMOTE
FD001 0.397 约0.43 约0.42 0.452
FD002 0.164 约0.30 约0.25 0.447
FD003 0.386 约0.42 约0.40 0.468
FD004 0.159 约0.32 约0.26 0.468

Diff-MTS 在全部四个子集上均取得最低判别分数,体现出对真实数据分布的最佳拟合。

8.4 结果二:多样性对比

图7 — 三种方法的PCA和t-SNE可视化对比(真实数据=蓝色,生成数据=棕色)

  • Diff-MTS:PCA 和 t-SNE 图中,生成数据与真实数据呈现宽广且高度混叠的分布,多样性最佳
  • GAN-based 方法:可见明显的聚类现象,生成数据部分覆盖,多样性受限
  • SMOTE:生成数据高度集中,呈现最差的多样性

8.5 结果三:下游预测维护任务

Table III — 不同数据增强策略在预测维护任务上的性能对比(RMSE/MAE)

关键结论如下:

① 扩散模型 + 混合训练策略在所有子集上取得最优结果:

  • FD001:RMSE = 13.446(较原始数据提升 7.0%),MAE = 9.387(提升 11.6%
  • FD004(最复杂工况):RMSE = 16.451(提升 41.2%),MAE = 12.615(提升 43.4%

② 扩散模型全面优于SMOTE混合策略: 在最具挑战性的 FD004 数据集上,扩散模型相比 SMOTE 进一步将 RMSE 降低 19.6%,充分体现其在捕捉非平稳时序模式方面的优越性。

③ 高质量合成数据单独使用已可超越原始数据: 仅使用扩散模型生成数据(不混合真实数据)时,在 FD001 上的 RMSE(13.688)和 MAE(9.846)已分别优于原始数据基线(14.453 和 10.617),体现出 Diff-MTS 生成数据的高保真性。


九、挑战与未来方向

论文从七个维度指出了工业生成模型的未来研究方向:

9.1 低质量与混合类型数据的生成

工业时序包含连续变量(温度、压力)和离散变量(设备状态、开关信息),同时面临噪声和异常值等质量问题。未来需要开发能够联合建模连续与离散变量的鲁棒生成框架。

9.2 长时序表达能力

工业时序存在强长程时间依赖,当前模型在捕捉这种长程关系上仍有不足。高级 RNN 结构、注意力机制和状态空间模型是三个有前景的方向。

9.3 可解释/可靠/可信生成模型

在工业决策场景中,生成数据不仅要准确,还要能被领域专家理解和信任。将物理先验知识(physics-informed)嵌入生成模型是提升可靠性和可解释性的关键路径,论文中的 CPI-GAN 是这一方向的代表性工作。

9.4 工业多模态生成模型

工业系统含有文本、数值、图像等多种模态数据,未来需要开发能有效融合多模态信息的生成框架,实现对工业系统状态的更完整建模。AnomalyGPT 是结合视觉语言大模型进行工业异常检测的代表性探索。

9.5 工业通用生成模型

训练有大规模工业时序数据的大型生成模型,使其具备跨领域、跨任务的泛化能力。One fits all、LLM4TS 等工作已初步验证了利用预训练语言模型增强时序建模的可行性。

9.6 面向智能制造的生成模型

生成模型可为工程师提供多样化的工业设计原型,加速产品创新。自动化代码生成(如核电站操作流程图到可执行代码的自动转换)是近期的一个具体应用方向。

9.7 伦理与隐私考量

生成模型的部署面临两大伦理挑战:算法偏见(历史数据中的偏见可能被放大)和数据隐私(合成数据可能泄露原始数据信息)。公平感知训练(fairness-aware training)、对抗去偏(adversarial debiasing)和联邦学习(federated learning)是三类主要应对手段。


十、总结

这篇综述的价值不只在于对现有文献的系统梳理,更在于它为工业 AI 的下一阶段指明了方向:

维度 DGMs(当前主流) LGMs(未来趋势)
适用领域 特定领域(如轴承、发动机) 多领域(跨设备、跨行业)
任务能力 单任务(如故障诊断) 多任务(异常检测、预测维护、插补…)
生成能力 专业化生成 通用化生成
代表模型 GAN、VAE、Diffusion GPT-4、DALL·E 的工业版本

图1 — DGMs与LGMs的对比示意图

扩散模型已在实验中证明了其超越 GAN 和传统方法的综合优势。而工业 LGM 的构建路线图——大规模数据集 → 专用架构 → 自监督预训练 → 多任务微调——为这一领域的下一个突破提供了清晰的技术蓝图。

工业 AIGC 的时代,刚刚开始。

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐