沈阳电吹风价格联盟

【干货 | 风电+AI】齿轮箱故障预警模型—基于自编码器与LSTM的实现

只看楼主 收藏 回复
  • - -
楼主

在政策驱动下,我国的风电行业已由快速发展逐步转向稳定、市场化发展。相较于较水电、光伏等新能源,风电行业的信息化较为成熟,因而具备较好的智能化条件和基础。其中,基于风场采集的SCADA数据进行故障诊断、故障预测建模,已成为风电行业的重要趋势。


在典型的大部件中,风力发电机齿轮箱,亦称变速箱,作为将叶轮转速提速为发电机所需转速的重要部件,在双馈式风力发电机中应用广泛。


当齿轮箱发生轻微故障时,若人工定检不能及时发现,小故障会伴随着风机继续运转,增加齿轮箱负荷,最终导致卡死、串轴、断裂等严重故障,给风场带来巨大的维修成本。


如果能通过数据及时发现齿轮箱的运行异常并实时报警,对于降低风机严重故障风险,提高风场发电效率具有重要意义。


01

齿轮箱数据概述

风力发电机的故障诊断、故障检测方面,常使用的数据有SCADA、CMS等数据。


SCADA作为集控系统的组成部分,其数据存储、提取、建模的过程较为容易。通常,对齿轮箱的测点包括齿轮箱油温、齿轮箱振动、齿轮箱轴转速、齿轮箱轴承温度等。


CMS通过采集高频振动数据,结合时域与频域的分析,给出齿轮箱振动异常的原因与是否需要停机维修的判断。


本次建模使用的数据为10s级别的SCADA数据,包含以上提及的SCADA数据特征。


02

建模思路

由于SCADA数据中齿轮箱的测点数较少,难以完全描述齿轮箱的运行状况,同时数据质量不佳,部分风机数据的时间间隔为12s,导致瞬时采样点数据时间戳不一致。针对这种情况,采用数据聚合的方法,将不同时间间隔的数据统一聚合为2min级别数据,提取每个特征在该段时间内的平均值、最小值、最大值。


采用聚合方式提取的数据,存在严重的线性相关,使用传统的统计学习方法(不包含树模型)会引入较大的误差,因此需要一层滤波,从原始的聚合数据中提取深层特征,同时需要确保这些特征可以较好地还原数据。因此模型使用降噪自编码器作为自动进行特征提取的工具。


按照2min的时间跨度聚合的数据较风电行业常用的10min级别数据,其时序特征较为明显。尤其在温度等特征方面,2min级别数据中描述了详细温度的变化特征,能够较好的反应风机运行过程中真实发生的工况。因此,在故障预测方面,采用基于LSTM架构的模型,以有效预测齿轮箱健康状况。


训练数据的标注方面,风场提供了齿轮箱故障发生的时间,将故障发生前一周的数据均标记为故障数据,同时选取一部分的齿轮箱未发生损坏的风机数据,以标签0作为正常风机的标注,用以训练模型。


首先,针对SCADA数据,进行按照时间聚合的数据操作;其次,构建降噪编码器模型,通过处理后的数据训练编码部分和解码部分,自动地使用神经网络提取2min级别数据的深层特征;最后,通过数据标签训练LSTM,输入编码后的结果,输出为风机在该时间段内是否发生故障的预测结果。


所有的算法开发与部署皆基于SkyAXE高速运算平台开发。



03

模型算法说明


降噪自编码器Denoising AutoEncoder)是一种较为鲁棒的自动特征提取模式,通过在编码前对数据引入噪声(通常为高斯噪声)破坏原始的数据分布,再通过编码-解码过程还原未加入噪声的数据,实现类似滤波(filter)后自动提取特征的过程。


 

通过引入噪声,破坏原始数据的标准分布后,再通过数据将其还原,模拟了人类对破损图像自动补全的过程,充分利用数据间的相关性,自动提取数据的深层特征,在大批量数据的特征提取方面,其效果较传统的PCA降维方法都有显著地提升,且具有较高的鲁棒性。反映于模型中,可看到其对聚合之后特征的还原效果较好,因此可将编码器部分作为LSTM网络的前半部分,对原始特征进行预处理:

 


LSTM通过引入Cell的结构,可记忆在时间序列上有所间隔的数据特征,在自然语言处理、视频分析、信号分析等方面已有大量成熟应用。其结构不在赘述。


04

模型架构


模型整体架构为降噪自编码器的编码部分后接LSTM网络结构,构建模型需要以下几个步骤:

Step 1:训练自编码器


由于降噪自编码器属于无监督学习的神经网络,即不需要外部的标签来训练。输入输出均为原始特征。训练中仍然采用批量训练方法,此时不需要关注聚合数据的故障与否,将全部数据进行训练即可得到能够自动提取深层特征的编码器;


Step 2:构建LSTM网络


由于数据量较大,LSTM模型的堆叠Cell数量较多,网络较深,容易产生梯度爆炸或梯度消失的问题。采用批标准化(Batch Normalization)对每一层的输出进行标准化,解决梯度传播的问题。同时,为了避免模型过拟合,在LSTM层和全连接层中,均使用了Dropout,降低过拟合的概率。构建起多层的LSTM网络后,接收编码器提取的深层特征;



 

Step 3:训练模型


使用降噪编码器提取的深层特征作为LSTM的数据,故障与否作为标签,训练LSTM模型。从训练误差的下降来看,模型具有较好的稳健性,误差可稳定的下降:



Step 4:模型测试


测试数据集为未用于训练的同风场其他几台风机数据,运行正常的风机没有报出故障,误报率接近于0。而故障风机主要呈现以下两种故障模型:


(1)突发故障


可能是由于瞬时风速过大,符合较大而导致的突发故障。模型在故障发生前并无给出明显的征兆,在系统报警的较近时间段才报出异常,此时风机可能已经处于齿轮箱故障发生的临界点,需要紧急停机进行维修;



(2)渐变故障

此类故障在发生前一段时间,模型已给出一些警报,此时对齿轮箱进行人工检查或维修,可以避免因严重故障导致的齿轮箱彻底更换,降低维修成本,提高风场的运营效率。

05

总结


齿轮箱是双馈式风力发电机的重要部件,其发生严重故障后更换齿轮箱的维修成本极高。若能尽早发现齿轮箱的损坏,并进行及时的维修,对于指导现场人员作业,实现智能化运营具有重要意义。


虽然模型有效地解决了该风场的离线数据问题,但在实际部署过程中,还需要考虑数据传输的质量、速度等因素,对模型参数进行不断修正,以提高预警的准确率。


随着风场信息化程度的不断提高,智能化必然成为风电行业未来的发展方向。引入AI的建模方法,将有助于提高模型的预测准确率,降低误报率,为业主带来真实的经济价值。



-THE END-



刘杨,天数润科数据挖掘工程师,绰号天数皮卡丘,负责 IoT 设备健康管理模型开发。熟悉机器学习算法和 AI 模型开发,研究方向为:强化学习、深度学习、工业和金融大数据 AI 应用。




技术干货 精彩回顾

 1.开源贡献|OpenTSDB-Keeper

 2.开源贡献|OpenTSDB Tableau WebData Connector(WDC)开发

 3.TensorFlow 分布式训练加速之梯度压缩

 4.【技术者专栏】实现 TensorFlow 多机并行线性加速

 5.【技术者专栏】叶根螺栓断裂故障检测模型—基于LSTM的实现

 6.【技术者专栏】时序数据库OpenTSDB构建工业大数据存储平台

‍‍‍‍‍




天数润科(全称"南京天数信息科技有限公司"),是一家提供行业AI 整体解决方案的高科技企业。公司由来自硅谷和国内领先 IT 企业的管理与行业专家组成,专注于智能计算领域,针对智能制造、智慧医疗、金融量化分析与交易三大领域,提供新一代智能数据平台整体解决方案,以及在此基础之上的超高性能机器学习/人工智能分析系统和云服务。天数润科的产品和服务致力于大幅提升用户的数据处理和分析能力,助力用户的数据分析向精准预测、认知和智能决策拓展,真正实现数据价值落地。


公司总部位于南京,在美国硅谷设有研发中心,国内上海、重庆设有子公司、长沙设有办事处,业务覆盖全国,并已和海内外多家科研院校和机构建立长期合作。


We are hiring!!


最新 销售、研发、运营 工作岗位出炉!


【销售】


销售总监

销售经理

售前工程师

销售经理

销售行政助理


~ 以上岗位,欢迎有制造、教育或医疗行业销售经验者加盟 ~


【研发】


机器学习平台架构工程师
机器学习平台工程师
数据库资深工程师
大数据资深工程师

【运营】


法务主管




更多岗位,请移步官网:www.sky-data.cn


请准备好你666666的简历

用力砸给我们敲可爱的人事小姐姐

recruiting@sky-data.cn



" 记得扫码关注哦,Pika!"


举报 | 1楼 回复

友情链接