国产成人超清在线视频,国产高清永久免费,国产最新超碰97上传无码,超碰国产人人草人人爽

寶信利用Spark Analytics Zoo對基于LSTM的時(shí)間序列異常檢測的探索

芯片
  • intel
  • 2018-10-16 15:10

摘要:寶信和英特爾相關(guān)團(tuán)隊(duì)利用Analytics Zoo在無監(jiān)督的基于時(shí)間序列異常檢測用例上進(jìn)行了有益的合作探索,本文分享了合作項(xiàng)目的結(jié)果和經(jīng)驗(yàn)。

背景

在工業(yè)制造行業(yè),有多種方法來避免由于設(shè)備失效導(dǎo)致的生產(chǎn)中斷。常見的方法是定期檢修維護(hù),或者提前更換設(shè)備零部件,這些方法都可能會增加設(shè)備維護(hù)和更換的投入。然而,另一個(gè)可行的方法是收集不同設(shè)備的大量振動(dòng)數(shù)據(jù),并使用這些數(shù)據(jù)自動(dòng)檢測設(shè)備狀態(tài)的異常。因此,有效地收集大量的時(shí)間序列數(shù)據(jù)并且大規(guī)模地進(jìn)行異常和失效檢測,對于降低工業(yè)制造行業(yè)中的的很多不必要的成本是非常關(guān)鍵的。

Recurrent neural networks (RNNs)循環(huán)神經(jīng)網(wǎng)絡(luò),特別是Long short term memory models (LSTMs)長短期記憶模型現(xiàn)在被廣泛應(yīng)用于信號處理,時(shí)間序列分析等場景。作為connectionist模型,RNNs可以提取網(wǎng)絡(luò)節(jié)點(diǎn)中的動(dòng)態(tài)序列。在這個(gè)項(xiàng)目中,我們利用LSTM來模擬震動(dòng)信號的統(tǒng)計(jì)學(xué)規(guī)律, 并且使用了來自辛辛那提大學(xué)的IMS全生命周期數(shù)據(jù) (http://ti.arc.nasa.gov/c/3/)來展示設(shè)備異常檢測的分析流程。

Analytics Zoo解決方案

Analytics Zoo (https://github.com/intel-analytics/analytics-zoo)是一個(gè)基于Apache Spark和BigDL等構(gòu)建的analytics (分析)+AI(人工智能)的平臺,由英特爾開源,該平臺能夠方便地讓用戶將端到端的基于大數(shù)據(jù)的深度學(xué)習(xí)應(yīng)用直接部署在已有的Hadoop/Spark的大數(shù)據(jù)集群上,而無需安裝專用的GPU設(shè)備。

 我們已經(jīng)在Apache Spark和Analytics Zoo上創(chuàng)建了端到端的基于LSTM的異常檢測流程,可以應(yīng)用于大規(guī)模時(shí)間序列數(shù)據(jù)的無監(jiān)督深度學(xué)習(xí)。作為LSTM模型的輸入數(shù)據(jù)的是一系列設(shè)備震動(dòng)信號,比如在當(dāng)前時(shí)間點(diǎn)之前50秒的信號數(shù)據(jù),通過這些信號數(shù)據(jù),經(jīng)過訓(xùn)練的模型可以預(yù)測下一個(gè)數(shù)據(jù)點(diǎn)。當(dāng)下一個(gè)數(shù)據(jù)點(diǎn)和模型預(yù)測的數(shù)據(jù)點(diǎn)有較大偏差,我們認(rèn)為該數(shù)據(jù)為異常數(shù)據(jù)。圖1所示為一個(gè)端到端的數(shù)據(jù)處理流程。

Analytics Zoo.jpg

圖1:基于Analytics Zoo的振動(dòng)時(shí)間序列異常檢測處理流程.

1.處理流程從Spark集群讀取原始數(shù)據(jù)并構(gòu)造RDD(resilient distributed datasets)彈性分布式數(shù)據(jù)集,并抽取特征,最后把特征輸出到Dataframe。在原始數(shù)據(jù)集中,每個(gè)數(shù)據(jù)描述了一個(gè)檢測失效(test-to-failure)的實(shí)驗(yàn),并包含了時(shí)長為1秒的20K赫茲采樣的即時(shí)振動(dòng)信號(如圖2所示)。為了訓(xùn)練深度學(xué)習(xí)模型,每一秒的統(tǒng)計(jì)數(shù)據(jù)被提取作為特征數(shù)據(jù),包括均方根(Root Mean Square), 峰度(Kurtosis),峰值( Peak), 以及小波包分解得到的8個(gè)頻段的能量值。

2.處理流程進(jìn)一步在RDD中處理這些特征數(shù)據(jù),包括數(shù)值的小波去噪處理、標(biāo)準(zhǔn)化處理(normalize)和滑動(dòng)平均處理,以50秒為基準(zhǔn)展開特征數(shù)據(jù)序列,以便于深度學(xué)習(xí)模型可以通過前50秒的模式來預(yù)測下一個(gè)數(shù)據(jù)點(diǎn),并最終把數(shù)據(jù)轉(zhuǎn)換為Sample RDD。(https://bigdl-project.github.io/master/#APIGuide/Data/#sample).

3.處理流程使用Analytics Zoo中提供的類Keras API來創(chuàng)建時(shí)間序列異常檢測模型,包括如圖所示的三個(gè)LSTM層和一個(gè)密集層,并通過數(shù)據(jù)訓(xùn)練這個(gè)模型(前50個(gè)點(diǎn)訓(xùn)練下一個(gè)點(diǎn))。

  val model = Sequential[Float]()

  model.add(LSTM[Float](8, returnSequences = true, inputShape = inputShape))

  model.add(Dropout[Float](0.2))

  model.add(LSTM[Float](32, returnSequences = true))

  model.add(LSTM[Float](15, returnSequences = false))

  model.add(Dense[Float](outputDim = 1))

4.接下來是模型評估:使用測試數(shù)據(jù)或者全部數(shù)據(jù)來檢測異常。異常數(shù)據(jù)是指遠(yuǎn)離RNN模型預(yù)測的數(shù)據(jù)點(diǎn)。在這個(gè)項(xiàng)目中,我們指定異常數(shù)據(jù)為整體數(shù)據(jù)集的10%,也就是距離模型預(yù)測數(shù)值最遠(yuǎn)的那10%數(shù)據(jù)為異常數(shù)據(jù)。這個(gè)篩選比例設(shè)置為可調(diào)整參數(shù),可以為每個(gè)單獨(dú)案例進(jìn)行調(diào)整。

LSTM data.jpg

圖2:時(shí)間點(diǎn)2004.02.13.14.32.39上四通道的振動(dòng)數(shù)據(jù)

測試結(jié)果

圖3顯示了原始振動(dòng)數(shù)據(jù)和LSTM模型預(yù)測數(shù)據(jù)的對比。只有峰值和均方根這兩個(gè)統(tǒng)計(jì)數(shù)值顯示出來,其他統(tǒng)計(jì)數(shù)值具有相似的波動(dòng)。圖中所示紅點(diǎn)為被識別的異常數(shù)據(jù),橙色線條為LSTM模型的預(yù)測數(shù)值,藍(lán)色線條為原始數(shù)值。經(jīng)過訓(xùn)練的模型最終成功預(yù)測了設(shè)備的失效,以及在經(jīng)過600個(gè)時(shí)間點(diǎn)之后的震動(dòng)尖峰,在時(shí)間序列早期的一些波動(dòng)可以作為設(shè)備失效的預(yù)警信息。

RNN1.jpg

RNN2.jpg

圖3: RNN預(yù)測數(shù)值和原始震動(dòng)數(shù)值的比較

結(jié)論

通過利用無監(jiān)督深度學(xué)習(xí),以及Analytics Zoo提供的端到端處理流程,我們可以有效地在大數(shù)據(jù)集和標(biāo)準(zhǔn)大數(shù)據(jù)集群(Hadoop, Spark等)上應(yīng)用時(shí)間序列異常檢測。通過收集、處理大量的時(shí)間序列數(shù)據(jù)(比如日志,傳感器讀數(shù)等),應(yīng)用RNN來學(xué)習(xí)數(shù)據(jù)模式,最終預(yù)判數(shù)據(jù)和判定異常數(shù)據(jù),Analytics Zoo提供的端到端處理流程能夠?yàn)樵S多新興的智能系統(tǒng)如智能制造、智能運(yùn)維、物聯(lián)網(wǎng)等提供解決方案?;跁r(shí)間序列的異常檢測在設(shè)備的智能監(jiān)控和預(yù)測性維護(hù)上可以得到重要應(yīng)用。

參考文獻(xiàn)

1. https://github.com/intel-analytics/analytics-zoo

2. https://github.com/intel-analytics/BigDL

3. https://www.kaggle.com/victorambonati/unsupervised-anomaly-detection

4. https://iwringer.wordpress.com/2015/11/17/anomaly-detection-concepts-and-techniques/


來源:intel

作者:孫海燕(寶信)、宋國瓊(英特爾)

編輯:jiyang

圖片來源:

本文鏈接: http://givenhand.cn/article/20181016/685.html

免責(zé)聲明:本網(wǎng)站出于傳播商業(yè)信息之目的進(jìn)行轉(zhuǎn)載發(fā)布,不代表 AIUST.Com 立場。本文所涉文、圖、音視頻等資料之一切權(quán)利和法律責(zé)任歸提供方所有和承擔(dān)。本網(wǎng)站對文中的圖文等所有信息的真實(shí)性不作任何保證或承諾,請讀者僅作參考,并自行核實(shí)相關(guān)內(nèi)容。本網(wǎng)站的任何內(nèi)容僅供參考,不能做為投資、采購或行為決策依據(jù),據(jù)此操作者風(fēng)險(xiǎn)自擔(dān)。

相關(guān)文章

資訊

原創(chuàng)

薦讀

  • 5G+AR加持 晨星機(jī)器人掀起“智能化+人機(jī)交互”制造新趨勢 5G+AR加持 晨星機(jī)器人掀起“智能化+人機(jī)交互”制造新趨勢

    2021世界制造業(yè)大會于11月22日在合肥落下帷幕。為期四天的大會中,作為向世界展示智能制造全面能力的窗口,聯(lián)想展示了一系列讓人驚喜的創(chuàng)新產(chǎn)品?,F(xiàn)場展示的ThinkPad X1 Fold整體重量僅有1公斤,折疊起來之后的厚度大約為24毫米。當(dāng)保持半開狀態(tài)時(shí),可以像拿本書一樣握住,并且能同時(shí)運(yùn)行兩個(gè)應(yīng)用程序。使用固定在中間的鍵盤之后,瞬間變...

  • 智能手機(jī)競爭中失敗,日本在聯(lián)網(wǎng)汽車領(lǐng)域舉步維艱 智能手機(jī)競爭中失敗,日本在聯(lián)網(wǎng)汽車領(lǐng)域舉步維艱

    據(jù)外媒報(bào)道,在制造帶有數(shù)字聯(lián)網(wǎng)服務(wù)的汽車的競爭中,豐田汽車和日產(chǎn)汽車面臨著被本土市場拖累的風(fēng)險(xiǎn)。與美國和歐洲的汽車消費(fèi)者不同的是,日本消費(fèi)者不愿意為這些聯(lián)網(wǎng)功能和服務(wù)買單。結(jié)果就是:日本只有10%的汽車...

  • 2020年河南省將推廣應(yīng)用3萬臺工業(yè)機(jī)器人 2020年河南省將推廣應(yīng)用3萬臺工業(yè)機(jī)器人

    到2020年,推廣應(yīng)用3萬臺工業(yè)機(jī)器人,建設(shè)1000條智能生產(chǎn)線、300個(gè)智能車間、150個(gè)智能工廠……4月16日,在2018兩岸智能裝備制造鄭州論壇上,河南省工信委發(fā)布了《2017年河南省智能制造白皮書》,河南智能制造的2020...

熱門標(biāo)簽