神經(jīng)網(wǎng)絡(luò)降維方法范文

時間:2024-03-28 16:38:48

導(dǎo)語:如何才能寫好一篇神經(jīng)網(wǎng)絡(luò)降維方法,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公文云整理的十篇范文,供你借鑒。

神經(jīng)網(wǎng)絡(luò)降維方法

篇1

關(guān)鍵詞:玉米種子;品種識別;人工神經(jīng)網(wǎng)絡(luò);支持向量機

中圖分類號:S513;S326 文獻標(biāo)識碼:A 文章編號:0439-8114(2016)09-2366-04

近年來,假種子事件頻發(fā),給農(nóng)業(yè)造成巨大損失,農(nóng)民由于缺乏識別種子的能力和設(shè)備,往往不能有效區(qū)分各個品種,迫切需要一種快速的種子識別方法。數(shù)字圖像識別作為一種快速識別技術(shù)而被廣泛應(yīng)用,在水稻、小麥和花生等作物種子識別上都有成功應(yīng)用的報道。

現(xiàn)代玉米種植和水稻一樣,廣泛雜交育種,不能自留種,增大了不法商家販賣假種子的空間。為了有效鑒別玉米種子的真?zhèn)魏皖悇e,郝建平等、楊錦忠等通過數(shù)十個外觀特征,采用圖像處理的方法識別種子:韓仲志等研究了對種子識別起關(guān)鍵作用的特征提取方法,如子粒的胚部特征和果穗DUS測試特征的提取方法:另外楊錦忠等針對玉米果穗形態(tài)研究了品種識別問題,對關(guān)鍵特征進行了選擇優(yōu)化。

在玉米識別相關(guān)算法和系統(tǒng)工程應(yīng)用之前,需要對品種識別過程中的關(guān)鍵因素進行有效的性能與效率測試。由于人工神經(jīng)網(wǎng)絡(luò)方法廣泛應(yīng)用于識別問題,本研究擬針對不同的神經(jīng)網(wǎng)絡(luò)模型進行比較研究,進而考察各種模型的效能,為將來品種識別軟件的開發(fā)與工程應(yīng)用提供算法支持。

1 材料與方法

1,1 試驗材料

供試玉米品種共11個,均是北方黃玉米品種,種質(zhì)來源為青島農(nóng)業(yè)大學(xué)種質(zhì)資源庫,每個品種50粒種子。采用平板掃描儀采集圖像(圖1)?;贛atalb2010b編程,采用子粒區(qū)域標(biāo)記的方法將圖像中各個子粒的子圖(SubImage)提取出來。然后進行特征提取。

1.2 特征提取

提取的特征包括顏色、形態(tài)和紋理3大類,見表1,相關(guān)定義參見文獻。從二值圖上提取形態(tài)特征,從RGB和HSV彩色圖獲取顏色特征,依據(jù)灰度圖像獲取紋理特征。

1.3 特征優(yōu)化

隨著統(tǒng)計指標(biāo)的增加,統(tǒng)計特征的維數(shù)相應(yīng)增加,因此也需要進行必要的降維和特征優(yōu)化。傳統(tǒng)的特征降維與優(yōu)化是基于二階統(tǒng)計量進行的主分量分析(PCA)方法。PCA是統(tǒng)計學(xué)中分析數(shù)據(jù)的一種有效的方法,其目的是在數(shù)據(jù)空間中找一組向量以盡可能地解釋數(shù)據(jù)的方差,將數(shù)據(jù)從原來的R維空間降維投影到M維空間(R>M)。降維后保存了數(shù)據(jù)中的主要信息,從而使數(shù)據(jù)更易于處理。PCA方法是沿數(shù)據(jù)集方差最大方向?qū)ふ乙恍┫嗷フ坏妮S,主成分分析方法是一種最小均方誤差下的最優(yōu)維數(shù)壓縮方法,特征提取和優(yōu)化后,特征維數(shù)將進一步減少。

1.4 品種識別

基于表1中的特征可實時進行品種識別。人工神經(jīng)網(wǎng)絡(luò)是模擬人的神經(jīng)感知結(jié)構(gòu),尋找非線性情況下的一種最優(yōu)映射,由于所提取的特征與玉米類別之間存在著非常復(fù)雜的非線性映射關(guān)系,所以特別適合采用此方法進行品種識別。由于神經(jīng)網(wǎng)絡(luò)的初始權(quán)值由系統(tǒng)隨機給出,所以往往帶來結(jié)果的不穩(wěn)定,通常的做法是多次測試取最優(yōu)實現(xiàn)。基于提取的特征數(shù)據(jù)即可進行種子檢驗和品種識別,本研究涉及的神經(jīng)網(wǎng)絡(luò)模型包括7種,即BP、rbf、grnn、pnn、compet、sofm,以及一個BP(backpropagation)神經(jīng)網(wǎng)絡(luò)的改進型,即極限學(xué)習(xí)機ELM。其中神經(jīng)網(wǎng)絡(luò)BP算法是最典型的神經(jīng)網(wǎng)絡(luò)分類方法。支持向量機(SVM)模型是近幾年發(fā)展起來的優(yōu)秀的識別模型,在農(nóng)作物種子識別領(lǐng)域已經(jīng)被證明比神經(jīng)網(wǎng)絡(luò)識別模型具有更為穩(wěn)健的性能。

2 結(jié)果與分析

圖2是6種神經(jīng)網(wǎng)絡(luò)識別模型的識別結(jié)果,圖3是BP神經(jīng)網(wǎng)絡(luò)的改進型極限學(xué)習(xí)機(ELM)與支持向量機(SVM)模型識別結(jié)果。表2為上述8種識別模型在不同主分量及不同特征下的識別效果。

2.1 不同模型的識別性能

比較6種神經(jīng)網(wǎng)絡(luò)識別模型可以發(fā)現(xiàn)(圖2、表2),首先從識別率上,基于60個原始統(tǒng)計特征,6種神經(jīng)網(wǎng)絡(luò)識別模型和1種改進型識別模型的識別性能從高到低為grnn>ELM>pnn>rbf>BP>compet>sofm,決定系數(shù)R2從大到小為grnn>rbf>ELM>BP>pnn>compet>sofm,所耗時間上從少到多為ELM

鑒于極限學(xué)習(xí)機ELM是廣泛應(yīng)用的BP神經(jīng)網(wǎng)絡(luò)的改進型,且其識別效果優(yōu)越,將其作為神經(jīng)網(wǎng)絡(luò)模型的代表與支持向量機模型進行比較。圖3列出了兩種模型的識別效果,部分數(shù)據(jù)在表2中有所體現(xiàn),可以看出支持向量機(SVM)模型的識別效果較好,且效果更為穩(wěn)定。

2.2 特征優(yōu)化對模型的影響

由于分類性能嚴重依賴特征的選取,這就表明某種特征的組合可能具有更優(yōu)秀的分類能力,此時主分量是一個很好的選擇,它不僅可以進行數(shù)據(jù)降維,還可以尋找對所有類都盡量適應(yīng)的優(yōu)化特征組合。表3列出了不同數(shù)目PCA情況下8種識別模型的識別性能。從表3可以看出,從識別率看,神經(jīng)網(wǎng)絡(luò)模型表現(xiàn)極其不穩(wěn)定,識別率并不是隨著PCA數(shù)目的增加而增加,但總體上還是呈增加趨勢,這種不穩(wěn)定性與神經(jīng)網(wǎng)絡(luò)初始權(quán)值的隨機賦值有關(guān),同時由于神經(jīng)網(wǎng)絡(luò)的隱含層神經(jīng)元數(shù)目到目前為止缺乏理論指導(dǎo),所以只能通過經(jīng)驗給出,故要得到較為穩(wěn)定的結(jié)果可通過多次訓(xùn)練得到較為穩(wěn)定的識別模型為止:但比較來看,支持向量機模型表現(xiàn)出更為穩(wěn)定的識別效果,且隨著PCA數(shù)目的增加。識別模型的總體識別率呈上升趨勢。另外從模型的決定系數(shù)和識別模型的時間上來看,支持向量機模型都是較為優(yōu)秀的模型。其中決定系數(shù)R2越接近于1,識別的時間越短,說明模型越優(yōu)秀。在這些模型中compet表現(xiàn)的效果最差,不僅識別的效果最差。且識別的時間最長。

3 小結(jié)與討論

從本研究的識別結(jié)果看。識別結(jié)果非常不穩(wěn)定,這種不穩(wěn)定的結(jié)果與兩個因素有關(guān),一是神經(jīng)網(wǎng)絡(luò)的不穩(wěn)定,與確定神經(jīng)網(wǎng)絡(luò)初始權(quán)值時隨機給出有關(guān),二是采用的交叉驗證法是隨機給出,隨機將訓(xùn)練和測試樣本進行分組,每次試驗選用了不同的訓(xùn)練集和測試集。

PCA是一種優(yōu)秀的特征優(yōu)化和數(shù)據(jù)降維方法,通過PCA降維可以在很大程度上提高運算速度,減少計算量,特別適合在線監(jiān)測。另外從比較結(jié)果可以看出,支持向量機是一種優(yōu)秀的分類模型,特別適合于對小樣本進行分類,其效果要優(yōu)于神經(jīng)網(wǎng)絡(luò)模型,且結(jié)果穩(wěn)定。支持向量機和神經(jīng)網(wǎng)絡(luò)雖然都用來進行品種識別,但所依據(jù)的理論基礎(chǔ)和識別機理均不相同。支持向量機普遍認為其泛化能力要比人工神經(jīng)網(wǎng)絡(luò)強:支持向量機模型理論基礎(chǔ)是結(jié)構(gòu)風(fēng)險最小化理論。也涉及模型參數(shù)優(yōu)化問題:另外支持向量機可以得到識別決策函數(shù)的解析表達式,而神經(jīng)網(wǎng)絡(luò)不能明確地得到一個解析解。

篇2

關(guān)鍵詞:圖像分類;深度學(xué)習(xí);Caffe框架;卷積神經(jīng)網(wǎng)絡(luò)

中圖分類號:TP18 文獻標(biāo)識碼:A 文章編號:1009-3044(2016)35-0209-03

Research and Implementation of Image Classification Based on Convolution Neural Network

WANG Chao

(Information Engineering Institute,East China University of Technology, Nanchang 330013, China)

Abstract: The problem of image classification has been the core problem in computer vision. A good solution is developed by further study which can solve the problem of extracting image features in image classification. In order to learn image features efficiently, constructing the machine learning model with hidden layer as well as training a large number of image data will eventually promote the accuracy of image classification or prediction. This paper is intended as an in-depth Caffe learning framework to construct a small image data-base. The convolutional neural network provided by Caffe framework will make a training analysis of the data set and then extract the information of target image features. These can be used for the final prediction of the target image. Compared with the traditional image classification algorithm, the accuracy of the prediction will be greatly improved.

Key words: image classification; deep learning; Caffe framework; Convolutional Neural Network

S著計算機與互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,我們已經(jīng)進入了一個以圖像構(gòu)建的世界。但是面臨有海量圖像信息卻找不到所需要的數(shù)據(jù)的困境,因而圖像分類技術(shù)應(yīng)運而生。通過各種機器學(xué)習(xí)算法使計算機自動將各類圖像進行有效管理和分類,但是由于圖像內(nèi)容包含著大量復(fù)雜且難以描述的信息,圖像特征提取和相識度匹配技術(shù)也存在一定的難題,要使得計算機能夠像人類一樣進行分類還是有很大的困難。

深度學(xué)習(xí)是近十年來人工智能領(lǐng)域取得的重要突破,在圖像識別中的應(yīng)用取得了巨大的進步,傳統(tǒng)的機器學(xué)習(xí)模型屬于神經(jīng)網(wǎng)絡(luò)模型,神經(jīng)網(wǎng)絡(luò)有大量的參數(shù),經(jīng)常會出現(xiàn)過擬合問題,因而對目標(biāo)檢測準(zhǔn)確率上比較低。本文采用卷積神經(jīng)網(wǎng)絡(luò)框架,圖像特征是從大數(shù)據(jù)中自動學(xué)習(xí)得到,而且神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)深由很多層組成,通過重復(fù)利用中間層的計算單元來減少參數(shù),在特征匯聚階段引入圖像中目標(biāo)的顯著信信息,增強了圖像的特征表達能力。通過在圖像層次稀疏表示中引入圖像顯著信息,加強了圖像特征的語義信息,得到圖像顯著特征表示,通過實驗測試,效果比傳統(tǒng)的圖像分類算法預(yù)測的準(zhǔn)確度有明顯的提升。

1 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類方法

1.1 人工神經(jīng)網(wǎng)絡(luò)

人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)是描述生物神經(jīng)網(wǎng)絡(luò)運行機理和工作過程的抽象和簡化了的數(shù)學(xué)物理模型,使用路徑權(quán)值的有向圖來表示模型中的人工神經(jīng)元節(jié)點和神經(jīng)元之間的連接關(guān)系,之后通過硬件或軟件程序?qū)崿F(xiàn)上述有向圖的運行[1]。目前最典型的人工神經(jīng)網(wǎng)絡(luò)算法包括:目前最典型的人工神經(jīng)網(wǎng)絡(luò)有BP網(wǎng)絡(luò) [2]Hopfield網(wǎng)絡(luò)[3]Boltzmann機[4]SOFM網(wǎng)絡(luò)[5]以及ART網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)[6],算法流程圖如圖1所示[7]。

1.2 卷積神經(jīng)網(wǎng)絡(luò)框架的架構(gòu)

Caffe是Convolutional Architecture for Fast Feature Embedding的縮寫[8],意為快速特征嵌入的卷積結(jié)構(gòu),包含最先進的深度學(xué)習(xí)算法以及一系列的參考模型,圖2表示的是卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖。Caffe深度學(xué)習(xí)框架主要依賴CUDA,IntelMKL,OpenCV,glog軟件以及caffe文件。本文使用的各個軟件版本說明,如表1所示。

Caffe深度學(xué)習(xí)框架提供了多個經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)模型,卷積神經(jīng)網(wǎng)絡(luò)是一種多層的監(jiān)督學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),利用隱含層的卷積層和池采樣層是實現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)特征提取功能,卷積神經(jīng)網(wǎng)絡(luò)模型通過采取梯度下降法最小化損失函數(shù)對網(wǎng)絡(luò)中的權(quán)重參數(shù)逐層反向調(diào)節(jié),通過頻繁的迭代訓(xùn)練來提高網(wǎng)絡(luò)的精度。卷積神經(jīng)網(wǎng)絡(luò)使用權(quán)值共享,這一結(jié)構(gòu)類似于生物神經(jīng)網(wǎng)絡(luò),從而使網(wǎng)絡(luò)的復(fù)雜程度明顯降低,并且權(quán)值的數(shù)量也有大幅度的減少,本文使用這些模型直接進行訓(xùn)練,和傳統(tǒng)的圖像分類算法對比,性能有很大的提升,框架系統(tǒng)訓(xùn)練識別基本流程如圖3表示。

1.3 圖像分類特征提取

卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)層次相比傳統(tǒng)的淺層的神經(jīng)網(wǎng)絡(luò)來說,要復(fù)雜得多,每兩層的神經(jīng)元使用了局部連接的方式進行連接、神經(jīng)元共享連接權(quán)重以及時間或空間上使用降采樣充分利用數(shù)據(jù)本身的特征,因此決定了卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比維度大幅度降低,從而降低計算時間的復(fù)雜度。卷積神經(jīng)網(wǎng)絡(luò)主要分為兩個過程,分為卷積和采樣,分別的對上層數(shù)據(jù)進行提取抽象和對數(shù)據(jù)進行降維的作用。

本文以Caffe深度學(xué)習(xí)框架中的 CIFAR-10數(shù)據(jù)集的貓的網(wǎng)絡(luò)模型為例,如圖4所示,對卷積神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練。CIFAR-10是一個標(biāo)準(zhǔn)圖像圖像訓(xùn)練集,由六萬張圖像組成,共有10類(分為飛機,小汽車,鳥,貓,鹿,狗,青蛙,馬,船,卡車),每個圖片都是32×32像素的RGB彩色圖像。通過對數(shù)據(jù)進行提取和降維的方法來提取圖像數(shù)據(jù)的特征。

2 實驗分析

將貓的圖像訓(xùn)練集放在train的文件夾下,并統(tǒng)一修改成256×256像素大小,并對貓的圖像訓(xùn)練集進行標(biāo)記,標(biāo)簽為1,運行選擇cpu進行訓(xùn)練,每進行10次迭代進行一次測試,測試間隔為10次,初始化學(xué)習(xí)率為0.001,每20次迭代顯示一次信息,最大迭代次數(shù)為200次,網(wǎng)絡(luò)訓(xùn)練的動量為0.9,權(quán)重衰退為0.0005,5000次進行一次當(dāng)前狀態(tài)的記錄,記錄顯示如下圖5所示,預(yù)測的準(zhǔn)度在98%以上。而相比傳統(tǒng)的圖像分類算法BP神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)的收斂性慢,訓(xùn)練時間長的,網(wǎng)絡(luò)的學(xué)習(xí)和記憶具有不穩(wěn)定性,因而卷e神經(jīng)網(wǎng)絡(luò)框架在訓(xùn)練時間和預(yù)測準(zhǔn)度上具有非常大的優(yōu)勢。

3 結(jié)束語

本文使用Caffe深度學(xué)習(xí)框架,以CIFAR-10數(shù)據(jù)集中貓的網(wǎng)絡(luò)模型為例,構(gòu)建小型貓的數(shù)據(jù)集,提取貓的圖象特征信息,最后和目標(biāo)貓圖像進行預(yù)測,并和傳統(tǒng)的圖像分類算法進行對比,預(yù)測的準(zhǔn)確率有很大的提升。

參考文獻:

[1] 楊錚, 吳陳沭, 劉云浩. 位置計算: 無線網(wǎng)絡(luò)定位與可定位性[M]. 北京: 清華大學(xué)出版社, 2014.

[2] 丁士折. 人工神經(jīng)網(wǎng)絡(luò)基礎(chǔ)[M]. 哈爾濱: 哈爾濱工程大學(xué)出版社, 2008.

[3] McClelland J L, Rumelhart D E, PDP Research Group. Parallel distributedprocessing[J]. Explorations in the microstructure of cognition, 1986, 2.

[4] Hopfield J J. Neural networks and physical systems with emergent collectivecomputational abilities[J]. Proceedings of the national academy of sciences, 1982, 79(8): 2554-2558.

[5] Ackley D H, Hinton G E, Sejnowski T J. A learning algorithm for boltzmannmachines[J]. Cognitive science, 1985, 9(1): 147-169.

[6] Kohonenmaps T. Self-Organized Formation of Topologically Correct Feature Maps[J]. Biological Cybernetics,1982, 43(1): 59-69.

篇3

本文提出了一種基于R、G、B值的BP神經(jīng)網(wǎng)路遙感影像分類算法,對待分類影像共選取三種樣本,獲取訓(xùn)練數(shù)據(jù)訓(xùn)練構(gòu)建好的BP神經(jīng)網(wǎng)絡(luò);使用訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)對高分影像分類,分類結(jié)果用三種不同的顏色標(biāo)識,通過目視判讀各個像元類別與BP神經(jīng)網(wǎng)絡(luò)分類結(jié)果對比,實驗結(jié)果表明該方法分類的精度較高,并具有一定的普遍性,為實現(xiàn)自動、半自動化遙感影像分類與識別提供了理論依據(jù)和技術(shù)方法途徑。

【關(guān)鍵詞】遙感 影像分類 BP神經(jīng)網(wǎng)絡(luò) 分類精度

1 引言

自20世紀(jì)70年代以來,遙感數(shù)字圖像分類處理一直是遙感技術(shù)及其相關(guān)領(lǐng)域?qū)W者們關(guān)注的問題。遙感數(shù)字圖像分類,亦稱計算機自動識別,其實質(zhì)在于通過計算機對遙感影像像元進行數(shù)值處理和分類,以達到自動識別地物的目的。傳統(tǒng)的模式識別分類方法一直被認為是遙感圖像分類處理的最佳方法。

在目前遙感分類中,用得較多的是傳統(tǒng)模式識別分類方法,如最小距離法、循環(huán)集群法等監(jiān)督與非監(jiān)督分類法。其分類結(jié)果由于遙感圖像的“同物異譜”與“異物同譜”現(xiàn)象存在,往往出現(xiàn)較多的錯分、漏分現(xiàn)象,導(dǎo)致分類精度不高。隨著遙感圖像解釋和分析的深入,統(tǒng)計模式識別方法的不足顯現(xiàn)出來,如K-均值聚類分類精度依賴于初始聚類中心;最大似然法計算強度大,且要求數(shù)據(jù)服從正態(tài)分布。尤其是近年來高光譜的廣泛應(yīng)用,各種新理論相繼出現(xiàn),對傳統(tǒng)的計算機分類方法提出了新要求。

隨著人工神經(jīng)網(wǎng)絡(luò)理論的發(fā)展,人工神經(jīng)網(wǎng)絡(luò)技術(shù)日益成為遙感圖像分類處理的有效手段,并逐步取代傳統(tǒng)的模式識別方法。人工神經(jīng)網(wǎng)絡(luò)具有良好的適應(yīng)能力,比之基于傳統(tǒng)統(tǒng)計理論的分類方法,它無須事先估計目標(biāo)的概率分布函數(shù),故在進行以數(shù)據(jù)量多、含混度高著稱的遙感影像的分類處理時,該方法能獲得很好的分類精度。本文簡單介紹人工神經(jīng)網(wǎng)絡(luò)分類算法,給出BP神經(jīng)網(wǎng)絡(luò)在遙感影像中分類方法。

2 基于BP神經(jīng)網(wǎng)絡(luò)的遙感影像分類方法

2.1 遙感影像分類原理

遙感影像記錄了地物在觀測時間內(nèi)的電磁波輻射特征,在影像中,同類地物在相同條件下,應(yīng)具有相同或相似的光譜、紋理、顏色等空間信息,而不同地物的光譜、紋理、顏色等空間信息特征不同,遙感影像分類正是根據(jù)地物光譜能量和空間結(jié)構(gòu)的差異性,利用計算機手段對各類地物信息進行分析和處理,將影像上的各像元劃分到對應(yīng)的地物類別中。

2.2 BP(Back-Propagation)神經(jīng)網(wǎng)絡(luò)分類器原理

BP(反向傳播)神經(jīng)網(wǎng)絡(luò)是利用非線性可微分函數(shù)進行權(quán)值訓(xùn)練的多層網(wǎng)絡(luò),包括輸入層、 中間層(隱層)和輸出層。當(dāng)學(xué)習(xí)樣本提供給網(wǎng)絡(luò)后,神經(jīng)元的激活值從輸入層經(jīng)各中間層向輸出層傳播,在輸出層的各神經(jīng)元獲得網(wǎng)絡(luò)的輸入響應(yīng)。接下來,按照減少目標(biāo)輸出與實際誤差的方向,從輸出層經(jīng)過各中間層逐層修正各連接權(quán)值,最后回到輸入層,因此這種算法稱為 “誤差逆?zhèn)鞑ニ惴ā保?BP 算法。隨著這種誤差逆的傳播修正不斷進行,網(wǎng)絡(luò)對輸入模式響應(yīng)的精度也不斷上升 。在 BP 網(wǎng)絡(luò)針對一個樣本對各個聯(lián)接權(quán)作一次修正后,雖然此樣本還不能滿足精度要求,此時也不能繼續(xù)按此樣本進行訓(xùn)練,而應(yīng)考慮其他的樣本,待樣本集中的所有的樣本都被考慮過一遍后,再重復(fù)這個過程,直到網(wǎng)絡(luò)能同時滿足各個樣本的要求,即誤差測度的總和滿足系統(tǒng)的要求為止。

2.3 基于BP(Back-Propagation)神經(jīng)網(wǎng)絡(luò)的遙感圖像分類器模型

BP神經(jīng)網(wǎng)絡(luò)技術(shù)應(yīng)用于遙感圖像分類,BP神經(jīng)網(wǎng)絡(luò)輸入層神經(jīng)元表征遙感影像的輸入模式,每一個輸入層神經(jīng)元對應(yīng)于一個像元R、G、B值特征,每一個輸出層神經(jīng)元對應(yīng)于一種土地覆蓋類型,每種土地類型用一種顏色標(biāo)識。

3 基于BP神經(jīng)網(wǎng)絡(luò)的遙感影像分類

3.1 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練

首先,根據(jù)分類結(jié)果選取數(shù)據(jù)樣本,由數(shù)據(jù)樣本得到訓(xùn)練樣本。訓(xùn)練樣本是以輸入、輸出對的向量模式來呈現(xiàn)的,其輸入向量是指樣本在參與分類的三個特征影像中的像元值,而輸出向量(期望輸出)是指該樣本對應(yīng)的類別。

(1)給出的各個樣本,逐一獲取每個樣本的的每一個像元R、G、B值,得到各個樣本R、G、B值矩陣。

(2)對各個樣本的R、G、B值矩陣進行降維處理,即將所有樣本R、G、B值矩陣變成一維向量的形式。

(3)得到BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練輸入矩陣:

(4)根據(jù)實際需要確定目標(biāo)向量的顏色類型,得到BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練輸出矩陣:

訓(xùn)練數(shù)據(jù)得到后,將訓(xùn)練數(shù)據(jù)逐個輸入BP神經(jīng)網(wǎng)絡(luò)進行正向運算,求出BP神經(jīng)網(wǎng)絡(luò)對每個訓(xùn)練數(shù)據(jù)在輸出層誤差,然后反向傳播對連接權(quán)值進行修正,完成一個樣本的訓(xùn)練過程。在訓(xùn)練期間,在輸出層上對每個輸入向量統(tǒng)計均方根誤差值,根據(jù)經(jīng)驗,當(dāng)均方根降至0.01該網(wǎng)絡(luò)已收斂,各連接的權(quán)值固定下來,可以用于高分影像分類。

3.2 分類結(jié)果的顯示

(1)獲取分類圖片的R、G、B值矩陣R[M,N]、G[M,N]、B[M,N]。

(2)對分類圖片的R、G、B值矩陣降維處理,即將R、G、B值矩陣變成一維向量的形式R[M*N]T、G[M*N]T、B[M*N]T。

(3)得到BP神經(jīng)網(wǎng)絡(luò)輸入矩陣p=[R[M*N]T G[M*N]T B[M*N]T]。

(4)將BP神經(jīng)網(wǎng)路輸入矩陣輸入到訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)中,得到要顯示圖像的R、G、B值矩陣, t=[R1[M*N]T G1[M*N]T B1[M*N]T]。 (3)

(5)得到要顯示圖像的R、G、B值一維向量的形式R1[M*N]T、G1[M*N]T、B1[M*N]T]。

(6)由要顯示圖像的R、G、B值一維向量,得到要顯示圖像R、G、B值矩陣R1[M,N]、B1[M,N]、G1[M,N],將要顯示的R、G、B值組合成影像進行顯示,如圖 2。

將該遙感圖像分成三類,湖泊、裸地、植被分類用黃色、黑色、紅色標(biāo)識,分類后的結(jié)果很明顯。

3.3 分類效果的評價

采用混淆矩陣及各統(tǒng)計參數(shù)來實現(xiàn)BP神經(jīng)網(wǎng)絡(luò)分類結(jié)果的精度評價。首先,對研究區(qū)域選取驗證數(shù)據(jù),其所屬的真實類別信息通過考察后已知,從而反應(yīng)真實類別;然后將驗證數(shù)據(jù)輸入到訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)中進行正向傳遞,獲得其對應(yīng)的網(wǎng)絡(luò)輸出值,從而判在BP網(wǎng)絡(luò)分類結(jié)果中所屬類別;最后根據(jù)所有驗證數(shù)據(jù)的真實類別和BP網(wǎng)絡(luò)分類類別建立混淆矩陣,計算各類統(tǒng)計參數(shù)用以評定分類精度。

在分類圖像上截取樣本(16*27=432),通過目視判讀,裸地119個像素,植被有個134像素,湖泊179個像素,則有表1。

通過以上計算,得到裸地、植被、湖泊的生產(chǎn)精度分別為79.83%、79.01%、100%,裸地、植被、湖泊的用戶精度分別為82.6%、85.48%、92.74%;總體分類精度為87.96,Kappa系數(shù)為0.8155,表明BP神經(jīng)網(wǎng)絡(luò)模型能有效的對遙感影像分類。

4 結(jié)論

本文針對高分遙感影像,提出了一種基于R、G、B值的BP神經(jīng)網(wǎng)路遙感處理算法。首先 ,獲取BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù);然后,構(gòu)建神經(jīng)BP神經(jīng)網(wǎng)絡(luò),利用得到的訓(xùn)練數(shù)據(jù)BP神經(jīng)網(wǎng)絡(luò)進行自學(xué)習(xí);最后,獲取待分類影像的數(shù)據(jù),進行分類顯示。得到的分類結(jié)果,選取生產(chǎn)精度、用戶精度、總體精度和Kappa系數(shù)作為評價指標(biāo)。結(jié)果表明:所提出的方法可有效地應(yīng)用于高空間分辨率遙感圖像分類工作中,并具有一定的普遍性,為實現(xiàn)自動、半自動化遙感影像分類與識別提供了理論依據(jù)和技術(shù)方法途徑。

參考文獻

[1]劉書含,顧行發(fā),余濤.高分一號多光譜遙感數(shù)據(jù)的面向?qū)ο蠓诸怺J].中國科學(xué)院遙感與數(shù)字地球研究所,2014,39(1):91-94.

[2]楊希.基于神經(jīng)網(wǎng)絡(luò)的高分辨率遙感影像分類研究[D].成都:西南交通大學(xué),2009

[3]王金亮,李石華.基于自組織神經(jīng)網(wǎng)絡(luò)的遙感圖像分類應(yīng)用研究[J].云南師范大學(xué)旅游與地理科學(xué)學(xué)院,2006,85(1):6-10.

[4]陳芳杰.基于BP神經(jīng)網(wǎng)絡(luò)遙感圖像特征分類研究[D].合肥:安徽大學(xué),2012.

[5]Window B.et al.Neural Networks Application industry,Business and munication of the ACM,19994,37:993-105.

[6]Special Issueon Application of Neural Network.Proc IEEE,1996,84(10).

作者簡介

高鴻斌(1964-),男,教授,碩士生導(dǎo)師,研究方向計算機測控和物聯(lián)網(wǎng)。

篇4

關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò);人臉識別;MATLAB

中圖分類號:TP391

隨著科技的發(fā)展,對人臉識別技術(shù)的發(fā)展要求越來越迫切,如(1)在企業(yè)、住宅安全和管理方面,要求實現(xiàn)人臉識別門禁考勤系統(tǒng),人臉識別防盜門等。(2)在公安、司法和刑偵方面,利用人臉識別,在全國范圍內(nèi)搜捕逃犯。(3)在銀行的自動提款機中,如果應(yīng)用人臉識別就會避免由于用戶卡片和密碼被盜。(4)在電子商務(wù)交易過程中,如果使用人臉識別實現(xiàn)當(dāng)事人在網(wǎng)上的數(shù)字身份和真實身份統(tǒng)一,便增加了電子商務(wù)的可靠性。而人臉識別的軟件系統(tǒng)開發(fā),是聯(lián)系理論和實踐的最重要的環(huán)節(jié),因此實現(xiàn)人臉識別系統(tǒng)的開發(fā)應(yīng)用越來越重要。

1 BP網(wǎng)絡(luò)的概述

1.1 BP神經(jīng)網(wǎng)絡(luò)的定義。前饋多層神經(jīng)網(wǎng)絡(luò)廣泛的應(yīng)用于模式識別與分類、控制、預(yù)測、圖像處理等問題,是當(dāng)今社會應(yīng)用最廣、發(fā)展最快的人工神經(jīng)網(wǎng)絡(luò)之一。由于此神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)權(quán)值閾值的確定常采用誤差反向傳播算法(Back Propagation,簡稱作BP算法),所以通常稱這種前饋網(wǎng)絡(luò)為BP網(wǎng)絡(luò)。典型的BP網(wǎng)絡(luò)是三層網(wǎng)絡(luò),包括輸入層、隱含層和輸出層。各層之間實行全連接,而其中隱含層可以是一層,也可以是多層(如圖1)。

圖1 單隱含層的BP網(wǎng)絡(luò)結(jié)構(gòu)

BP網(wǎng)絡(luò)的學(xué)習(xí)由四個過程組成,即:(1)輸入模式:輸入層經(jīng)隱含層向輸出層的“模式順傳播”過程;(2)網(wǎng)絡(luò)的理論輸出與網(wǎng)絡(luò)實際輸出之差的誤差信號:由輸出層經(jīng)隱含層向輸入層逐層修正連接權(quán)的“誤差逆?zhèn)鞑ァ边^程;(3)由“模式順傳播”與“誤差逆?zhèn)鞑ァ钡姆磸?fù)交替進行的網(wǎng)絡(luò)“記憶訓(xùn)練”過程;(4)網(wǎng)絡(luò)趨向收斂即網(wǎng)絡(luò)的全局誤差趨向極小值的“學(xué)習(xí)收斂”過程。簡言之,就是由“模式順傳播”“誤差逆?zhèn)鞑ァ薄坝洃浻?xùn)練”“學(xué)習(xí)收斂”的過程。傳遞函數(shù)一般為(0,1)S型函數(shù) 。BP網(wǎng)絡(luò)隱層中的神經(jīng)元均采用S型交換函數(shù),輸出層則采用純線性變換函數(shù)。

1.2 BP網(wǎng)絡(luò)的算法。BP算法可描述為大致五步:(1)初始化各權(quán)值為較小的隨機值;(2)選取訓(xùn)練集;(3)根據(jù)輸入計算理論輸出;(4)調(diào)節(jié)輸出層和隱含層的連接權(quán)值;(5)返回第二步反復(fù)訓(xùn)練網(wǎng)絡(luò)直至誤差理想為止。

其流程圖如圖2:

圖2 神經(jīng)網(wǎng)絡(luò)算法流程圖

2 BP神經(jīng)網(wǎng)絡(luò)實現(xiàn)人臉識別

2.1 設(shè)計思路。本設(shè)計采用50幅圖像(10個人每人5幅)作為訓(xùn)練圖像,應(yīng)用主成分分析對訓(xùn)練圖像進行二階相關(guān)和降維,提取訓(xùn)練圖像的獨立基成分構(gòu)造人臉子空間,并將訓(xùn)練集中的人臉圖像向獨立基上投影得到的系數(shù)輸入改進的BP神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練。然后將待識別的人臉圖像向獨立基上投影得到投影系數(shù),再將其輸入已訓(xùn)練過的BP神經(jīng)網(wǎng)絡(luò)進行識別。設(shè)計結(jié)構(gòu)如圖3。

圖3 人臉識別系統(tǒng)結(jié)構(gòu)

2.2 BP網(wǎng)絡(luò)的創(chuàng)建和初始化。因網(wǎng)絡(luò)的輸入矢量與輸出矢量相差較大,為了減少網(wǎng)絡(luò)的訓(xùn)練誤差,在建立網(wǎng)絡(luò)之前要對輸入矢量進行歸一化。這里我們利用premnmx函數(shù)把輸入初始化在[-1,1]之間。程序代碼如下:

p=premnmx(p')';

t=[1000;1000;1000;1000;1000;0100;0100;0100;0100;0100;

0010;0010;0010;0010;0010;0001;0001;0001;0001;0001]'

2.3 訓(xùn)練神經(jīng)網(wǎng)絡(luò)。本設(shè)計的方法如下:

%設(shè)計神經(jīng)網(wǎng)路

[prow pcol]=size(p);

num=prow*pcol;%提取p中元素個數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入層神經(jīng)元個數(shù)

net=newff(minmax(p),[num,10,4],{'tansig','tansig','purelin'},'traingda');%隱層神經(jīng)元個數(shù)為10,輸出層神經(jīng)元個數(shù)為4,4表示識別出人

net.trainParam.show=200;%顯示速率為200

net.trainParam.lr=0.01;%學(xué)習(xí)率為0.01

net.trainParam.epochs=5000;%迭代次數(shù)不超5000

net.trainParam.goal=0.001;%訓(xùn)練誤差為0.001

[net,tr]=train(net,p,t);

網(wǎng)絡(luò)的訓(xùn)練函數(shù)有很多種,如trainlm,其中traingd學(xué)習(xí)算法是一般的剃度下降法;traingdx學(xué)習(xí)算法是剃度下降動量法,學(xué)習(xí)速率是自適應(yīng)的。Trainlm的學(xué)習(xí)算法為Levenberg-Marquadt反傳算法,該訓(xùn)練函數(shù)的優(yōu)點在于收斂速度很快。本設(shè)計選用的訓(xùn)練函數(shù)為traingdx,在網(wǎng)絡(luò)達到起訓(xùn)練誤差要求時會自動停止,節(jié)省訓(xùn)練時間。訓(xùn)練過程中為了得到較小的誤差,可以增加訓(xùn)練次數(shù)。

2.4 系統(tǒng)的性能評估。為了測試設(shè)計的網(wǎng)絡(luò)模式識別系統(tǒng)的可靠性,這里用50幅圖像輸入樣本,來觀察其輸出結(jié)果。通過程序演示,基本可以識別出不同的人臉特征。如果要提高精度,可以延長網(wǎng)絡(luò)的訓(xùn)練時間,或者是將網(wǎng)絡(luò)隱含層的神經(jīng)元數(shù)目增多。為了測試系統(tǒng),可提取幾取幾幅人臉圖片數(shù)據(jù),然后把它們輸入到網(wǎng)絡(luò)中,觀察其得到的輸出,并進行誤差分析。

3 結(jié)束語

本設(shè)計是利用BP算法,以MATLAB軟件作為工具手段,建立人臉識別的BP神經(jīng)網(wǎng)絡(luò),且利用50副人臉圖像數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò),使神經(jīng)網(wǎng)絡(luò)能辨別出人臉信息。結(jié)果說明,本設(shè)計在人臉識別方面有比較好的優(yōu)勢。

在本設(shè)計中,使用了不人臉圖像數(shù)據(jù)作為輸入來訓(xùn)練網(wǎng)絡(luò),提高了整個網(wǎng)絡(luò)容錯的能力,這樣更適合在實際環(huán)境中使用。

參考文獻:

[1]藺廣逢,繁引娣,張媛.主成分分析與BP神經(jīng)網(wǎng)絡(luò)的人臉識別方法研究[J].現(xiàn)代電子技術(shù),2007(02).

[2]MartinT.Hag,Howard B.Demuth. Neural Network Design Original[M].PSW publishing company.

[3]張威.MATLAB基礎(chǔ)與編程入門[M].西安:西安電子科技大學(xué)出版社,2004.

[4]叢爽.面向MATLAB工具箱的神經(jīng)網(wǎng)絡(luò)理論與應(yīng)用[M].合肥:中國科學(xué)技術(shù)大學(xué)出版社,2003.

篇5

關(guān)鍵詞能源需求預(yù)測,粒子群算法,BP神經(jīng)網(wǎng)絡(luò),主成分分析法

中圖分類號F201 文獻標(biāo)識碼A

Construction of Energy Demand Forecasting

Model and Empirical Analysis of Guangdong Province

YE Yiyong

(College of Economics & Management Wuyi University Jiangmen, Guangdong 529020,China)

AbstractIn order to make accurate forecast for energy demand of Guangdong province, this paper analyzed the various factors which impact on energy demand of Guangdong province, and constructed the predict index system. On this basis, according to the nonlinear characteristics of the energy system, combined with the advantages of particle swarm optimization algorithm and BP neural network, a prediction model was constructed based on PSOBP neural network. And the method of principal component analysis was used to reduce the dimensions of the prediction index system in order to reduce the size and complexity of the neural network. Then, this paper simulated the energy demand data of Guangdong province from 1985 to 2013, and carried on the forecast energy demand of Guangdong province during 2014 to 2018. The theoretical analysis and empirical study show that this method can reflect the characteristics of energy demand of Guangdong province, and the predicted result is more accurate and reasonable.

Key words forecasting of energy demand, PSO, BP neural network, PCA

1引言

隨著社會經(jīng)濟的快速發(fā)展,各行業(yè)對能源的需求大幅度增加.據(jù)統(tǒng)計,廣東省2000年的能源消耗量是7 983萬噸標(biāo)準(zhǔn)煤,2013年的能源消耗量上升到25 645萬噸標(biāo)準(zhǔn)煤,是2000年消耗量的3.2倍,其中一次能源消費90%依賴省外,二次能源消費中的電力消費有10%也是依賴省外,據(jù)估算,未來10年這個比例將達到30%左右.經(jīng)濟快速發(fā)展所帶來的巨大能源需求與供給不足之間的矛盾越來越嚴重,能源短缺已成為制約廣東省經(jīng)濟持續(xù)發(fā)展的關(guān)鍵問題,如果不采取有效的措施,將會延緩廣東省產(chǎn)業(yè)結(jié)構(gòu)的轉(zhuǎn)型升級優(yōu)化,乃至影響全省經(jīng)濟的穩(wěn)步增長.系統(tǒng)地分析廣東省能源需求的影響因素,準(zhǔn)確地預(yù)測廣東省未來能源需求的數(shù)量,進而制定科學(xué)合理的能源發(fā)展戰(zhàn)略,確保廣東省經(jīng)濟可持續(xù)發(fā)展,具有非常重要的現(xiàn)實意義.

2文獻綜述

能源系統(tǒng)是一個復(fù)雜的非線性系統(tǒng),其需求量受到眾多因素的影響.當(dāng)前很多學(xué)者已經(jīng)對能源需求問題進行了深入的研究,使用的預(yù)測方法包括趨勢外推法、消費彈性法、主要消耗部門預(yù)測法、回歸分析法預(yù)測等[1-3],取得了一定的效果.但在預(yù)測精度方面還存在一定的差距,一方面是由于能源系統(tǒng)本身的復(fù)雜性、非線性、非確定性的特征導(dǎo)致的,另一方面是因為預(yù)測方法本身還存在一些不足之處,不足以完全準(zhǔn)確反映預(yù)測目標(biāo)和指標(biāo)體系之間的數(shù)量關(guān)系.要解決上述問題,除了需要構(gòu)建科學(xué)的預(yù)測指標(biāo)體系,更關(guān)鍵的就是要尋找更加科學(xué)有效的預(yù)測方法.

鑒于此,部分學(xué)者開始研究能源系統(tǒng)的非線性和不確定性等系統(tǒng)特征,如自組織特征、分形特征、混沌特征和模糊性等,并在此基礎(chǔ)上引進非線性方法對能源需求進行預(yù)測,如非線性/混沌時間序列方法、遺傳算法、灰色理論、人工神經(jīng)網(wǎng)絡(luò)方法等[4-8],這些方法可以彌補線性模型在預(yù)測復(fù)雜能源需求時的不足.其中具有代表性的方法是人工神經(jīng)網(wǎng)絡(luò),它是由大量神經(jīng)元通過極其豐富和完善的連接而構(gòu)成的自適應(yīng)、非線性動態(tài)系統(tǒng),它從結(jié)構(gòu)、實現(xiàn)機理和功能上模擬生物神經(jīng)網(wǎng)絡(luò),通過并行分布式的處理方法,克服了傳統(tǒng)的基于邏輯符號的人工智能在處理直覺、非結(jié)構(gòu)化信息方面的缺陷,具有自適應(yīng)、自組織和實時學(xué)習(xí)的特點[9].它在解決非線性及高維模式識別問題中表現(xiàn)出許多特別的優(yōu)勢,受到學(xué)者的青睞.當(dāng)前,已有眾多學(xué)者將神經(jīng)網(wǎng)絡(luò)及其擴展模型應(yīng)用于時間序列預(yù)測方面,并取得了很好的效果[10-15].

通過對文獻的綜合分析發(fā)現(xiàn),神經(jīng)網(wǎng)絡(luò)及其相關(guān)的模型已經(jīng)被廣泛應(yīng)用到金融、工業(yè)、交通等領(lǐng)域,但是在能源需求預(yù)測領(lǐng)域的應(yīng)用較少.針對廣東省能源需求系統(tǒng)具有非線性和影響因素眾多等特征,建立了基于改進的PSOBP神經(jīng)網(wǎng)絡(luò)的預(yù)測模型,給出了方法的基本原理和具體實現(xiàn)步驟,然后通過對廣東省1985―2013年能源需求歷史數(shù)據(jù)的建模和仿真,驗證了方法的有效性,最后對廣東省未來5年的能源需求進行預(yù)測,為能源管理者提供決策參考的依據(jù).

3廣東省能源需求影響因素分析

能源需求受到多方面因素的影響,本文結(jié)合其他學(xué)者的研究成果[16-18],遵循可獲得性、可比性、實際性、綜合性的原則,從以下幾個方面對影響能源需求的因素進行分析.

①經(jīng)濟增長.經(jīng)濟增長是影響能源需求的主要因素,隨著廣東省社會經(jīng)濟的快速發(fā)展和產(chǎn)業(yè)結(jié)構(gòu)的持續(xù)優(yōu)化,對能源的需求量將在很長一段時間內(nèi)保持較高的水平.衡量經(jīng)濟增長的指標(biāo)本文采用國內(nèi)生產(chǎn)總值(GDP).

②產(chǎn)業(yè)結(jié)構(gòu)調(diào)整.三大產(chǎn)業(yè)中,工業(yè)的發(fā)展對經(jīng)濟增長的貢獻最大,對能源的需求也最大,第一、第三產(chǎn)業(yè)對能源的需求相對較少.工業(yè)的快速發(fā)展所帶來的負面影響是顯而易見的.近年來,廣東省在產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化和轉(zhuǎn)型升級方面出臺了一系列的政策措施,隨著我省產(chǎn)業(yè)結(jié)構(gòu)的調(diào)整,對能源需求數(shù)量的必將產(chǎn)生很大的影響.

③能源消費結(jié)構(gòu).該項指標(biāo)反映了各種消費能源在消費總量中所占的比例關(guān)系,廣東省的能源消費以煤為主,據(jù)統(tǒng)計,超過50%的能源來自煤炭燃燒.煤炭為不可再生能源,利用率較低,容易污染環(huán)境,政府在大力推行開發(fā)可再生能源和清潔能源,改善能源消費結(jié)構(gòu),降低能耗指數(shù).

④技術(shù)進步.首先是通過先進技術(shù)的應(yīng)用,改善生產(chǎn)工藝和流程,提高能源的利用率,節(jié)約能源消費;其次是將技術(shù)應(yīng)用于新能源開發(fā),從而改變能源消費結(jié)構(gòu),進而影響能源消費總量.由于技術(shù)進步難以量化,本文使用單位GDP的能耗來表示.

⑤人口和城市化.能源是人類生存和發(fā)展的物質(zhì)前提,人類的衣食住行與能源息息相關(guān),人口基數(shù)越大,對能源的需求量就越大,隨著工業(yè)化、城鎮(zhèn)化進程的加快,人民生活水平穩(wěn)步提升,對能源需求的影響更加明顯.

⑥居民生活消費水平.居民生活水平的提高,以及消費觀念和消費行為的變化,會直接導(dǎo)致產(chǎn)業(yè)結(jié)構(gòu)的變動,進而影響能源消費的數(shù)量,特別是增加對電力、液體和氣體燃料等優(yōu)質(zhì)能源的需求.

綜上所述,影響能源需求的主要因素有經(jīng)濟的增長(廣東省GDP)、產(chǎn)業(yè)結(jié)構(gòu)(工業(yè)在國民經(jīng)濟中的比重)、能源消費結(jié)構(gòu)(煤炭的消費比重)、技術(shù)進步(單位GDP的能耗)、人口(廣東省人口數(shù)量)、城市化(全省城鎮(zhèn)人口所占的比重)、居民人均消費水平,預(yù)測對象為廣東省每年的能源消費數(shù)量.

4PSOBP能源需求預(yù)測模型構(gòu)建

4.1BP神經(jīng)網(wǎng)絡(luò)模型

BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)的主要特點是信號向前傳遞,誤差反向傳播.在前向傳遞中,輸入信號從輸入層經(jīng)過隱含層逐層處理,直至輸出層.每一層的神經(jīng)元狀態(tài)只影響下一層神經(jīng)元狀態(tài).如果輸出層得不到期望輸出,則轉(zhuǎn)入反向傳播,根據(jù)預(yù)測誤差調(diào)整網(wǎng)絡(luò)權(quán)值和閾值,從而使BP神經(jīng)網(wǎng)絡(luò)預(yù)測輸出不斷逼近期望輸出[19].BP神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)如圖1所示,BP算法如下.

1)各層權(quán)值及閾值的初始化.

2)輸入訓(xùn)練樣本,并利用訓(xùn)練樣本對網(wǎng)絡(luò)進行訓(xùn)練,計算各層輸出.

3)求出并記錄各層的反向傳輸誤差.

4)按照權(quán)值以及閾值修正公式修正各層的權(quán)值和閾值.

5)按照新的權(quán)值重復(fù)2)和3).

6)若誤差符合預(yù)設(shè)要求或者達到最大學(xué)習(xí)次數(shù),則終止學(xué)習(xí).

7)使用訓(xùn)練好的模型對預(yù)測樣本進行預(yù)測.

4.2標(biāo)準(zhǔn)粒子群優(yōu)化算法

粒子群優(yōu)化算法(Particle Swarm Optimization)源于對鳥類捕食行為的研究,鳥類捕食時,每只鳥找到食物最簡單有效的方法就是搜尋當(dāng)前距離食物最近的鳥的周圍區(qū)域.PSO算法就是從這種生物種群行為特征中得到啟發(fā)并用于求解優(yōu)化問題的.算法中每個粒子代表問題的一個潛在解,每個粒子對應(yīng)一個由適應(yīng)度函數(shù)決定的適應(yīng)度值.粒子的速度決定了粒子移動的方向和距離,速度隨自身及其他粒子的移動經(jīng)驗進行動態(tài)調(diào)整,從而實現(xiàn)個體在可解空間的尋優(yōu)[19].

假設(shè)粒子群的種群規(guī)模為Z,搜索空間為Y維,第i個粒子的位置表示為

Xi={xi1,xi2,…,xiY},i=1,2,…,Z,第i個粒子的速度表示為Vi={vi1,vi2,…,viY,第i個粒子的個體極值表示為Pi={pi1,pi2,…,piY,當(dāng)前的全局極值表示為Pg={pg1,pg2,…,pgY.因此,粒子的速度與位置按下式更新:

Vi(k+1)=ωVi(k)+c1r1(Pi(k)-Xi(k))+

c2r2(Pg(k)-Xi(k)),

Xi(k+1)=Xi(k)+Vi(k+1),

vij(k+1)=vmax,vij(k)>vmax,

-vmax,vij(k)

其中,ω為慣性權(quán)重,是平衡粒子的全局搜索能力和局部搜索能力的參數(shù);c1和c2為加速因子,是調(diào)整粒子自身經(jīng)驗和群體經(jīng)驗對粒子運動軌跡的影響的參數(shù);r1和r2是在[0,1]區(qū)間內(nèi)均勻分布的兩個隨機數(shù);vmax為粒子的最大速度,是用來限制粒子的速度的參數(shù),vij為第i個粒子在第j維的速度.

4.3改進的粒子群優(yōu)化算法

標(biāo)準(zhǔn)的粒子群算法雖然具有收斂速度快、通用性強等優(yōu)點,但由于算法實現(xiàn)過程僅利用了個體最優(yōu)和全局最優(yōu)的信息,因此導(dǎo)致種群的多樣性消失過快,出現(xiàn)早熟收斂、后期迭代效率不高、容易陷入局部最優(yōu)等缺點,增加了尋找全局最優(yōu)解的難度.要解決上述問題,可以從以下兩方面進行改進.

4.3.1動態(tài)調(diào)整慣性權(quán)重

慣性權(quán)重ω用來控制粒子之前的速度對當(dāng)前速度的影響,它將影響粒子的全局和局部搜索能力.較大的ω值有利于全局搜索,較小ω值有利于局部搜索,但在標(biāo)準(zhǔn)的PSO算法中,ω的值是固定的,在算法運行過程中,根據(jù)實際情況給ω賦予動態(tài)變化的值,使得算法能夠平衡全局和局部搜索能力,這樣可以以最少的迭代次數(shù)找到最優(yōu)解.經(jīng)驗參數(shù)是將ω初始值設(shè)定為0.9,并使其隨迭代次數(shù)的增加線性遞減至0.3,以達到上述期望的優(yōu)化目的.通過線性轉(zhuǎn)換來完成上述參數(shù)值變化的過程.

ω=ωmax-ωmax-ωminnN. (2)

其中ωmax,ωmin分別是ω的最大值和最小值,n和N是當(dāng)前迭代次數(shù)和最大迭代次數(shù),在迭代開始時設(shè)ω=ωmax,ω在迭代過程中逐漸減小,直到ω=ωmin.

這樣設(shè)置使PSO算法能夠更好的控制探索與開發(fā)的關(guān)系,在開始優(yōu)化時搜索較大的解空間,找到合適的粒子,然后在后期逐漸收縮到較小的區(qū)域進行更精細的搜索以加快收斂速度.

4.3.2增加粒子的多樣性

在此借鑒遺傳算法中變異的思想,對部分符合條件的粒子以一定的概率重新初始化,目的是通過變異操作來保持種群的多樣性,拓展種群的搜索空間,使得粒子能夠跳出當(dāng)前局部最優(yōu)的位置,在更大的空間繼續(xù)搜索全局最優(yōu)值.引入線性動態(tài)變異算子:

Fn=Fmin-nN(Fmin-Fmax).(3)

式中,F(xiàn)n為當(dāng)前的變異概率;n為當(dāng)前的迭代次數(shù);N為最大的迭代次數(shù);Fmax,F(xiàn)min為最大的變異概率和最小的變異概率.

剛開始迭代時,種群以一個極小的概率發(fā)生變異,至迭代后期,變異概率迅速擴大,粒子可以迅速跳出當(dāng)前的搜索區(qū)域,在更大的區(qū)域內(nèi)尋找最優(yōu)解.

4.4改進的PSOBP神經(jīng)網(wǎng)絡(luò)模型

BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程主要是權(quán)值和閾值的更新過程,采用的學(xué)習(xí)算法是以梯度下降為基礎(chǔ)的,但梯度下降法的訓(xùn)練效果過于依賴初始權(quán)值的選擇,且存在訓(xùn)練時間長、易陷入局部極小等問題.而粒子群算法可以避免梯度下降法中要求函數(shù)可微、對函數(shù)求導(dǎo)的過程,也避免了遺傳算法中的選擇、交叉等操作,具有收斂速度快、記憶性強和全局搜索能力較強等特點[20],可以將兩種算法結(jié)合起來,利用PSO算法中粒子的位置來對應(yīng)神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)中的連接權(quán)值和閾值,以神經(jīng)網(wǎng)絡(luò)的輸出誤差作為PSO算法的適應(yīng)函數(shù),通過PSO算法的優(yōu)化搜索來訓(xùn)練神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,可以彌補BP網(wǎng)絡(luò)在學(xué)習(xí)能力和收斂速度上的不足,既充分發(fā)揮了神經(jīng)網(wǎng)絡(luò)的非線性映射能力,還可以縮短神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時間,提高預(yù)測的精度.

PSO優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的主要步驟如下.

1)初始化.根據(jù)BP神經(jīng)網(wǎng)絡(luò)的輸入樣本,建立BP神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu),輸入層節(jié)點數(shù),隱含層節(jié)點數(shù),輸出層節(jié)點數(shù);初始化粒子的位置和速度,以及粒子數(shù)、最大迭代次數(shù)、慣性權(quán)重、學(xué)習(xí)因子等參數(shù).

2)通過網(wǎng)絡(luò)訓(xùn)練,計算粒子的適應(yīng)度值,得到粒子的個體最優(yōu)值與全局最優(yōu)值.將粒子適應(yīng)度值與個體最優(yōu)值和全局最優(yōu)值相比較,記錄當(dāng)前粒子所經(jīng)歷的最好位置.

3)考察每一個粒子的適應(yīng)度值.若該值優(yōu)于個體最優(yōu),則將當(dāng)前值置為個體最優(yōu),并更新該粒子的個體最優(yōu);若粒子中的個體最優(yōu)優(yōu)于當(dāng)前的全局最優(yōu),則將個體最優(yōu)置為全局最優(yōu),并更新全局最優(yōu)值.

4)將經(jīng)過PSO優(yōu)化的權(quán)值和閾值作為BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值代入BP網(wǎng)絡(luò),訓(xùn)練至滿足網(wǎng)絡(luò)的性能指標(biāo),即均方誤差小于預(yù)先設(shè)定的誤差要求或達到最大迭代次數(shù)時,停止迭代,輸出結(jié)果,否則轉(zhuǎn)到2,繼續(xù)迭代直至算法收斂.

5)由訓(xùn)練和測試樣本完成神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和測試,輸出預(yù)測值.如圖2所示.

5.2數(shù)據(jù)預(yù)處理

為了消除各指標(biāo)不同量綱的影響,需要對數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,以解決指標(biāo)之間的可比性.本文使用離差標(biāo)準(zhǔn)化的方法,對原始數(shù)據(jù)進行線性變換,使變換后的值映射到[0,1]之間,并保持原本的數(shù)量關(guān)系,變換公式如(4)式所示.

Yi=(Xi-min)/(max-min).(4)

其中,Yi是樣本i歸一化的值,Xi是樣本i的值,min為樣本最小值,max為樣本最大值.但這個方法有個缺點,當(dāng)有新的樣本數(shù)據(jù)加入時,數(shù)據(jù)的最大值和最小值可能會發(fā)生變化,需要重新計算Yi值.

在預(yù)測或者評價完成后,再使用反歸一化的方法對數(shù)據(jù)進行還原處理,得出其真實值,具體的數(shù)據(jù)處理過程可以直接調(diào)用Matlab工具箱里的Mapminmax函數(shù)來完成.

5.3數(shù)據(jù)降維

就神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)而言,預(yù)測指標(biāo)體系越龐大,指標(biāo)數(shù)量越多,模型就越復(fù)雜,預(yù)測結(jié)果的不確定性就越大,相應(yīng)地,模型的泛化能力會降低,同時也會增加運算的時間.因此有必要對前面確定的影響能源需求的指標(biāo)進行定量化的分析,在盡量減少信息丟失的前提下減少指標(biāo)的個數(shù),即完成樣本指標(biāo)的降維.

主成分分析法就是通過線性變換的方法,把原始變量組合成少數(shù)幾個具有代表意義的指標(biāo),使得變換后的指標(biāo)能夠更加集中地反映研究對象特征的一種統(tǒng)計方法[21].對樣本的原始數(shù)據(jù)進行主成分分析,得到各個主成分的特征值和方差貢獻率,如表2所示.

從表2的數(shù)據(jù)可知,當(dāng)抽取的主成分為Y1,Y2時,主成分的累計方差貢獻率已達到93.22%,基本覆蓋了原來7個指標(biāo)所包含的信息.因此可以把Y1,Y2這2個主成分的數(shù)據(jù)作為模型的輸入,這樣就大幅度減少了神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點數(shù),降低了模型的復(fù)雜程度,同時也有利于前期樣本數(shù)據(jù)的獲取.

根據(jù)主成分分析法得出前2個主成分的系數(shù)如表3所示.

從表達式(5)可以看出,第一主成分Y1與x1、x2、x5、x6、x7均保持了較強的正相關(guān),而與x3,x4呈現(xiàn)出負相關(guān),這個數(shù)量關(guān)系說明了第一主成分基本反映了上述指標(biāo)的信息.由于x1、x2、x5、x6、x7是從不同的方面反映了社會經(jīng)濟發(fā)展的水平,而x3和x4反映了能源消費的狀況,因此,第一主成分Y1是綜合反映了經(jīng)濟發(fā)展?fàn)顩r和能源需求之間的密切關(guān)系.

從表達式(6)可以看出,第二主成分Y2與x1、x2、x3、x4相關(guān)性較強,其中與x3(能源結(jié)構(gòu))是高度相關(guān)的,說明第二主成分基本反映了這個指標(biāo)的信息.

5.4模型參數(shù)設(shè)置

神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)一般由樣本的輸入和輸出指標(biāo)數(shù)量確定,由于使用PCA做數(shù)據(jù)降維后,樣本數(shù)據(jù)的維數(shù)為2,輸出數(shù)據(jù)維數(shù)為1,所以確定模型的輸入節(jié)點數(shù)為2,輸出節(jié)點數(shù)為1.本文選用的是三層的BP神經(jīng)網(wǎng)絡(luò)模型,關(guān)于隱含層數(shù)目的確定,目前沒有一個通用的方法,只能根據(jù)經(jīng)驗或者多次試驗來決定.由于隱含層的數(shù)量會影響到模型的學(xué)習(xí)時間、擬合效果以及泛化能力,因此必須確定一個最佳的隱含層單元數(shù),根據(jù)相關(guān)學(xué)者的研究結(jié)論,隱含層的數(shù)量與問題的要求、輸入、輸出指標(biāo)的個數(shù)都有關(guān)系,且其數(shù)量關(guān)系符合以下的計算公式[21]:

R=S1+S2+a.(7)

其中R為隱含層單元數(shù),S1、S2分別為輸入層和輸出層的數(shù)量,a為[1,10]之間的常數(shù).經(jīng)過循環(huán)比較算法,得出R的值為4時,模型具有較好的學(xué)習(xí)效果和泛化能力,因此本文確定神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)為2-4-1,隱層使用sigmoid函數(shù),輸出層使用pureline函數(shù),神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)效率取0.1,訓(xùn)練次數(shù)為150,輸出目標(biāo)值為0.001.粒子群規(guī)模為50,迭代次數(shù)為100,學(xué)習(xí)因子c1=1.7,c2=1.5,慣性權(quán)重ωmax=0.9,ωmin=0.3,粒子速度最大值為5,最小值為-5.

5.5模型訓(xùn)練

本文選取前24個樣本數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),用于確定模型的相關(guān)參數(shù),剩余5個樣本作為測試數(shù)據(jù),用于檢驗?zāi)P偷男Ч?

將訓(xùn)練數(shù)據(jù)代入模型進行計算,得到的適應(yīng)度曲線變化如圖3所示,訓(xùn)練值與實際值比較如圖4所示,可以看出PSOBP模型對歷史數(shù)據(jù)的學(xué)習(xí)情況非常理想,大部分樣本的訓(xùn)練值與實際值基本吻合,個別樣本有一定的偏差,但在合理的誤差范圍之內(nèi),說明該模型的構(gòu)建是行之有效的.

5.6模型測試

將訓(xùn)練后的模型對5個預(yù)測樣本數(shù)據(jù)進行預(yù)測,并把預(yù)測值與實際值進行比較,結(jié)果如表4所示,預(yù)測結(jié)果如圖5所示,樣本誤差如圖6所示.可以看到,2009-2013年的預(yù)測準(zhǔn)確度非常高,平均誤差為2.3%,以2009年為例,預(yù)測偏差為2.87%,換算成實際的偏差數(shù)量就是552.95萬噸標(biāo)準(zhǔn)煤,準(zhǔn)確的預(yù)測結(jié)果將為能源規(guī)劃與實施提供有力的依據(jù).

由表5可知,PSOBP模型的預(yù)測平均誤差為2.3%,BP模型的平均預(yù)測誤差為4.8%,說明經(jīng)過粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)參數(shù)后,不僅使得模型的收斂速度加快,運算時間減少,同時在預(yù)測精度方面也有了很大的提升.

5.7不同方法預(yù)測結(jié)果比較

為了體現(xiàn)PSOBP神經(jīng)網(wǎng)絡(luò)模型的優(yōu)勢,本文同時使用未經(jīng)優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)進行訓(xùn)練和預(yù)測,并將兩種預(yù)測結(jié)果進行比較,具體數(shù)據(jù)見表5所示,比較效果如圖9和圖10所示.

5.8未來5年能源需求預(yù)測

根據(jù)上述預(yù)測模型和流程,對廣東省未來5年的能源需求進行預(yù)測,這里假設(shè)未來5年各項樣本指標(biāo)均保持當(dāng)前的增長速度,得出的結(jié)果見表6.

從表6可知,未來5年,廣東省的能源需求將持續(xù)增長,平均保持5.7%的增長率,并且增長的速度逐步加快,2018年的需求量將達到33 842.34萬噸標(biāo)準(zhǔn)煤.因此,如何針對快速增長的能源需求,采取有效的措施來解決供需不平衡的矛盾,將是決策者需要考慮的問題.根據(jù)廣東省發(fā)改委2013年底公布的《廣東省能源發(fā)展十二五規(guī)劃》,在保證全省能源供應(yīng)能力的前提下,將進一步加快能源消費結(jié)構(gòu)的調(diào)整,構(gòu)建與科學(xué)發(fā)展要求相適應(yīng)的安全、穩(wěn)定、經(jīng)濟、清潔的現(xiàn)代能源供應(yīng)保障體系,具體措施是進一步優(yōu)化能源結(jié)構(gòu)和布局,提升能源利用效率,逐步降低單位GDP能耗,并且爭取在新能源的利用開發(fā)方面取得突破性進展,從而為全省經(jīng)濟社會發(fā)展提供強有力的能源保障.

6結(jié)論

對廣東省的能源需求問題進行了深入的研究,在結(jié)合定性和定量分析的基礎(chǔ)上,確定了影響能源需求的主要因素,構(gòu)建了PSO-BP神經(jīng)網(wǎng)絡(luò)的能源需求預(yù)測模型,并對廣東省2014-2018年的能源需求進行了預(yù)測.理論分析和實證研究表明,該方法能夠很好的反映廣東省能源需求的特征,預(yù)測結(jié)果較為準(zhǔn)確合理.但就本文所考慮的預(yù)測指標(biāo)體系而言,以定量的指標(biāo)為主,如何在模型中把政策法規(guī)、環(huán)境保護等難以定量的影響因素包含進來,構(gòu)建更為完善的預(yù)測指標(biāo)體系,以及當(dāng)樣本數(shù)量較少的時候,如何保證模型的學(xué)習(xí)能力和泛化能力,這些問題需要繼續(xù)完善解決.

參考文獻

[1]林伯強.中國能源需求的經(jīng)濟計量分析[J].統(tǒng)計研究, 2001(10):34-39.

[2]韓君.中國能源需求的建模與實證分析[D].蘭州商學(xué)院, 2007.

[3]魏一鳴等.中國能源需求報告(2006):戰(zhàn)略與政策研究[M].北京:科學(xué)出版社, 2006.

[4]A S WEIGEND . Time series analysis and predicationusing gated experts with application to energy demandforecast[J]. Applied Articial Intelligence, 1996(6):583-624.

[5]V GEVORGIAN , M KAISER . Fuel distribution andconsumption simulation in the republic of Armenia[J]. Simulation, 1998(3):154-167.

[6]張玉春,郭寧,任劍翔.基于組合模型的甘肅省能源需求預(yù)測研究[J].生產(chǎn)力研究, 2012(11):31-34.

[7]馮亞娟,劉曉愷,張波.基于QGALSSVM的能源需求預(yù)測[J].科技與經(jīng)濟,2014(3):56-61.

[8]蘆森.基于組合模型的中國能源需求預(yù)測[D].成都:成都理工大學(xué), 2010.

[9]李琳娜.基于核主成分分析(KPCA)和神經(jīng)網(wǎng)絡(luò)的單目紅外圖像深度估計[D].上海:東華大學(xué), 2013.

[10]張均東,劉澄,孫彬.基于人工神經(jīng)網(wǎng)絡(luò)算法的黃金價格預(yù)測問題研究[J].經(jīng)濟問題, 2010(1):45-48.

[11]熊志斌.ARIMA融合神經(jīng)網(wǎng)絡(luò)的人民幣匯率預(yù)測模型研究[J].數(shù)量經(jīng)濟技術(shù)經(jīng)濟研究, 2011(6):75-81.

[12]龍文,梁昔明,龍祖強,等.基于混合進化算法的RBF神經(jīng)網(wǎng)絡(luò)時間序列預(yù)測[J].控制與決策, 2012(8):20-25.

[13]王慶榮,張秋余.基于隨機灰色蟻群神經(jīng)網(wǎng)絡(luò)的近期公交客流預(yù)測[J].計算機應(yīng)用研究, 2012(6):32-37.

[14]張大斌,李紅燕,劉肖,等.非線性時間序列的小波-模糊神經(jīng)網(wǎng)絡(luò)集成預(yù)測方法[J].中國管理科學(xué), 2013(2):81-86.

[15]高玉明,張仁津.基于遺傳算法和BP神經(jīng)網(wǎng)絡(luò)的房價預(yù)測分析[J].計算機工程, 2014(4):187-191.

[16]伍秀君.廣東省能源需求預(yù)測分析及能源發(fā)展對策研究[D].廣州:暨南大學(xué),2007.

[17]薛黎明.中國能源需求影響因素分析[D].徐州:中國礦業(yè)大學(xué),2010.

[18]秦國真.云南能源需求影響因素分析及預(yù)測[D].昆明:云南財經(jīng)大學(xué),2012.

[19]來建波.基于神經(jīng)網(wǎng)絡(luò)的路段行程時間預(yù)測研究[D].昆明:云南大學(xué), 2011.

篇6

(1.黑龍江八一農(nóng)墾大學(xué),黑龍江 大慶 163319;2.長春理工大學(xué),長春 130022;

3.大慶油田有限責(zé)任公司第一采油廠,黑龍江 大慶 163162)

摘要:提出了一種基于近紅外透射光譜及最速下降BP算法識別大豆油質(zhì)量的方法。光譜采集范圍是10 000~4 000 cm-1,將得到的近紅外光譜數(shù)據(jù)作為網(wǎng)絡(luò)的輸入神經(jīng)元,利用主成分分析方法得出8個變量指標(biāo)數(shù),該變量指標(biāo)對樣品累計貢獻率達到99.9%以上;將8個主成分的特征值作為BP網(wǎng)絡(luò)的輸入向量,建立BP神經(jīng)網(wǎng)絡(luò)模型。該模型對預(yù)測樣品集能正確判別,判別正確率達到100%。

關(guān)鍵詞 :近紅外透射光譜;BP神經(jīng)網(wǎng)絡(luò);豆油質(zhì)量分析

中圖分類號: O657.33文獻標(biāo)識碼:A文章編號:0439-8114(2015)01-0175-03

DOI:10.14088/j.cnki.issn0439-8114.2015.01.045

Quality Analysis of Soybean Oil based on Near Infrared Transmission Spectra and Artificial Neural Network Model

CAI Li-jing1,CAI Li-juan2,LI Wen-yong3,ZHAO Xiao-yu1,SHANG Ting-yi1

(1. Heilongjiang Bayi Agricultural University,Daqing 163319,Heilongjiang,China;2. Changchun University of Sciences and Technology,Changchun 130022,China;3. The Fist Oil Production Company, Daqing oilfield,Daqing 163162,Heilongjiang,China)

Abstract: A method based on near infrared transmission spectra and gradient descent BP algorithm was used to analyzed the quality of soybean oil. The range of 10 000 to 4 000 cm-1 spectral was acquired, then the near infrared spectrum data was input to BP network. Eight variable indexes were obtained with principal component analysis. The cumulative contribution rate of the 8 variable indexes was more than 99.9%. Using the 8 index as input vectors of BP neural networks model, it can discriminate the quality of samples with the accuracy of 100%.

Key words:near infrared transmission spectroscopy;BP neural network;soybean oil quality analysis

收稿日期:2014-03-20

基金項目:黑龍江省教育廳科學(xué)技術(shù)研究項目(12521378)

作者簡介:蔡立晶(1977-),女,吉林前郭人,講師,碩士,主要從事電磁場微波技術(shù)及光電檢測技術(shù)的教學(xué)與研究工作,(電話)13845942988(電子信箱)threeminimoons@126.com。

近紅外光譜技術(shù)具有快速、高效、無污染、無需前處理、無損分析及多組分同時測定等優(yōu)點,在快速檢測領(lǐng)域有較大的潛力和發(fā)展空間。近紅外光譜分析技術(shù)用于食用油品質(zhì)分析檢測目前也有一些研究報道,主要用于油脂的品質(zhì)檢測[1]。西方國家最早利用近紅外技術(shù)進行油脂品質(zhì)分析。近紅外技術(shù)結(jié)合判別分析方法等,在橄欖油[2,3]、堅果油[4]及其他植物油[5]的檢測中已得到成功應(yīng)用。劉福莉等[6]以8種食用油純油的43個樣品為對象,研究了近紅外透射光譜結(jié)合聚類分析法快速鑒別食用油種類的可行性,判別模型對預(yù)測集樣品的準(zhǔn)確率達到100%。范璐等[7]利用氣相色譜和傅里葉變換紅外吸收光譜,對21種花生油、20種棕櫚油及兩者的4種調(diào)和油進行分析,對花生油和棕櫚油做了識別分析。近紅外光譜技術(shù)在摻偽檢測中有著很多的應(yīng)用[8],翁欣欣等[9]研究了橄欖油中摻偽情況研究,采用BP神經(jīng)網(wǎng)絡(luò)對摻偽橄欖油和未摻偽橄欖油進行了鑒別,對52個樣品進行了預(yù)測,預(yù)測準(zhǔn)確率為100%。隨著營養(yǎng)學(xué)的研究發(fā)展,評估食用植物油的營養(yǎng)價值,研究分析常用食用植物油中的脂肪酸的組成是有意義的,吳靜珠等[10,11]對食用油脂肪酸的定量分析進行了研究,人們對植物油中脂肪酸的認識不斷增加。

人工神經(jīng)網(wǎng)絡(luò)方法是一種具有很強函數(shù)逼近能力的非線性建模方法,在人工神經(jīng)網(wǎng)絡(luò)的實際應(yīng)用中,BP網(wǎng)絡(luò)廣泛應(yīng)用于函數(shù)逼近、模式識別/分類、數(shù)據(jù)壓縮等。陳建等[12]提出了一種采用近紅外光譜技術(shù)結(jié)合人工神經(jīng)網(wǎng)絡(luò)對玉米品種進行鑒別的方法,試驗結(jié)果說明該方法能快速無損地鑒別玉米品種,為玉米的品種鑒別提供了一種新方法。羅一帆等[13]進行了近紅外光譜測定茶葉中茶多酚和茶多糖的人工神經(jīng)網(wǎng)絡(luò)模型研究,建立近紅外光譜測定茶葉中茶多酚和茶多糖的模型,由此說明建立的近紅外光譜-人工神經(jīng)網(wǎng)絡(luò)模型可用于預(yù)測茶葉中茶多酚和茶多糖的含量。趙肖宇等[14]研究應(yīng)用近紅外透射光譜和人工神經(jīng)網(wǎng)絡(luò)的豆油脂良莠鑒別,建立3層BP神經(jīng)網(wǎng)絡(luò)模型,模型能夠有效辨識未知豆油脂的良莠以及不合格具體種類,類別預(yù)測正確率為100%。

本研究采用基于近紅外透射光譜及神經(jīng)網(wǎng)絡(luò)中的最速下降BP算法的方法,對純大豆油和摻雜大豆油進行真?zhèn)舞b別研究。

1 材料與方法

1.1 儀器

采用北京瑞利分析儀器公司W(wǎng)QF-510型傅里葉變換紅外光譜儀。室溫介于15~30 ℃,相對濕度的允許范圍小于60%。儀器預(yù)熱,系統(tǒng)通過自檢且已獲得本底光譜時,開始掃描樣品。采集光譜范圍10 000~4 000 cm-1,采樣分辨率為4 cm-1,掃描次數(shù)32次,液體池6 mL玻璃器皿。

1.2 材料

樣品包括兩種,純大豆油和摻雜大豆油,全部樣品未經(jīng)任何化學(xué)處理。所使用的純大豆油是超市購買的九三大豆油,摻雜大豆油是指純大豆油中摻入一定比例的豬油。為了使配置的摻雜大豆油得以充分混合,在制備樣品前,先把豬油放在恒溫箱中加熱使其成液體狀態(tài),取一定量的豬油混合到純大豆油中進行充分攪拌使其充分混合。將帶有樣品的器皿放入傅里葉變換紅外光譜儀中進行光譜采集。每種樣品光譜采集為30個樣品,共收集60個樣品的光譜信號。

2 結(jié)果與分析

2.1 光譜采集

純大豆油和摻雜大豆油的近紅外透射光譜見圖1。由圖1可見,摻雜大豆油與純大豆油圖譜之間的差異不明顯。近紅外光譜圖之間的差異很小,很難通過直觀的分析對兩種油進行鑒別。

2.2 主成分數(shù)據(jù)處理

將asf文件轉(zhuǎn)換為ASC碼文件,每條譜圖數(shù)據(jù)量為1 556個,共計得到60×1 556個全波段數(shù)據(jù)點,試驗訓(xùn)練樣品集數(shù)為50個,而且直接把光譜矩陣X50x1 556作為神經(jīng)網(wǎng)絡(luò)的輸入,則輸入元為1 556個,BP網(wǎng)絡(luò)的規(guī)模較為復(fù)雜。將原始光譜矩陣進行主成分分解,主成分分析是把原來多個變量劃為少數(shù)幾個綜合指標(biāo)的一種統(tǒng)計分析方法,從數(shù)學(xué)角度來看,這是一種降維處理技術(shù)。以減少神經(jīng)網(wǎng)絡(luò)輸入的神經(jīng)元。

采用Matlab的矩陣計算功能來編程實現(xiàn)主成分分析。主成分分析計算步驟為計算相關(guān)系數(shù)矩陣和計算特征值與特征向量,以及計算主成分貢獻率及累計貢獻率。特征根數(shù)量為8,即得到8個主成分,即val1,val2,val3,val4,val5,val6,val7,val8其累積貢獻率分別為70.17%,90.42%,97.13%,98.78%,99.56%,99.88%,99.96%,99.99%。采用8個變量指標(biāo)數(shù),對樣品計算累計貢獻率均達到99.9%以上,基本可以涵蓋樣品光譜圖的所有信息,因此紅外透射光譜數(shù)據(jù)得到了最大程度不失真簡化。將分解得到的矩陣T50x8作為BP網(wǎng)絡(luò)的輸入神經(jīng)元。此時,BP網(wǎng)絡(luò)的輸入元從1 556降為8個,也就是8個主成分的特征值作為BP網(wǎng)絡(luò)的輸入向量。

2.3 神經(jīng)網(wǎng)絡(luò)建模與分析

BP網(wǎng)絡(luò)的設(shè)計主要包括輸入層、隱層、輸出層及各層之間的傳遞函數(shù)等[15,16]。通用的神經(jīng)網(wǎng)絡(luò)需要預(yù)先確定網(wǎng)絡(luò)的層數(shù),而BP網(wǎng)絡(luò)可以包含不同的隱層。理論上已經(jīng)證明,在不限制隱層節(jié)點數(shù)的情況下,兩層(只有一個隱層)的BP網(wǎng)絡(luò)可以實現(xiàn)任意非線性映射。在模式樣本相對較少的情況下,較少的隱層節(jié)點可以實現(xiàn)模式樣本空間的超平面劃分,此時選擇兩層BP網(wǎng)絡(luò)就可以了,當(dāng)模式樣本數(shù)很多時,減少網(wǎng)絡(luò)規(guī)模,增加一個隱層是必要的,但BP網(wǎng)絡(luò)隱層數(shù)一般不超過兩層。

試驗采集光譜樣品數(shù)為60個,隨機抽取50個作為訓(xùn)練集,10個作為驗證集。在BP網(wǎng)絡(luò)設(shè)計中,數(shù)據(jù)主要分為兩類模式,用1個輸出元素即可表示,采用兩層BP網(wǎng)絡(luò)來實現(xiàn)分類。因為BP網(wǎng)絡(luò)的輸出為logig函數(shù),所以目標(biāo)向量的取值為0.2和0.8,分別對應(yīng)兩類模式。在程序設(shè)計時,通過判決門限0.5區(qū)分兩類模式,輸出元素分別為0和1。采用最速下降BP算法訓(xùn)練該網(wǎng)絡(luò)。訓(xùn)練曲線訓(xùn)練經(jīng)過了5 000次仍未達到要求的目標(biāo)誤差0.001,雖然訓(xùn)練的誤差性能未達到要求的目標(biāo)誤差,但這并不妨礙用測試樣本對網(wǎng)絡(luò)進行仿真。

利用建立的BP網(wǎng)絡(luò)模型對剩下的10個預(yù)測集樣品進行鑒別,摻雜大豆油樣品預(yù)測樣本數(shù)為5個,純大豆油預(yù)測樣本數(shù)為5個。預(yù)測結(jié)果見表1。預(yù)測樣品集可以做到正確的判別,判別正確率達到100%。

3 結(jié)論

采用大豆油為研究對象,利用傅里葉變換近紅外光譜儀采集大豆油的近紅外透射光譜,通過主成分分析及神經(jīng)網(wǎng)絡(luò)技術(shù)對光譜數(shù)據(jù)進行分類識別。結(jié)果表明,近紅外透射光譜的網(wǎng)絡(luò)建立及仿真可完成兩類模式的分類。采用純大豆油與摻雜大豆油兩種的透射光譜,對光譜預(yù)處理,抽出8個主成分作為神經(jīng)網(wǎng)絡(luò)的輸入神經(jīng)元,建立最速下降BP網(wǎng)絡(luò)模型,對預(yù)測集大豆油預(yù)測結(jié)果正確率為100%。試驗表明將近紅外透射光譜與神經(jīng)網(wǎng)絡(luò)技術(shù)相結(jié)合能夠快速檢測大豆油是否摻雜,從而為檢測大豆油的品質(zhì)提供一種簡單有效的方法。

參考文獻:

[1] 于燕波,臧 鵬,付元華,等.近紅外光譜法快速測定植物油中脂肪酸含量[J].光譜學(xué)與光譜分析,2008,28(7):1554-1558.

[2] 張 欣,于瑞祥,方曉明,等.橄欖油摻假檢測技術(shù)的研究進展[J].中國油脂,2013,38(3):67-71.

[3] 林遠輝,高 蓓,李玉玉,等.橄欖油摻假鑒別技術(shù)研究進展[J].食品科學(xué),2013,34(5):279-283.

[4] 魏長賓,劉勝輝,臧小平,等.澳洲堅果油脂肪酸組成分析[J].中國油脂,2008,33(9):75-76.

[5] 李宗朋,王 健,張曉磊,等.基于近紅外光譜技術(shù)的沙棘籽油鑒偽方法研究[J].中國油脂,2014,39(2):57-62.

[6] 劉福莉,陳華才,姜禮義,等.近紅外透射光譜聚類分析快速鑒別食用油種類[J].中國計量學(xué)院學(xué)報,2008,3(19):278-282.

[7] 范 璐,吳娜娜,霍權(quán)恭,等.氣相色譜分析和傅里葉變換紅外吸收光譜識別花生油中棕櫚油[J].河南工業(yè)大學(xué)學(xué)報(自然科學(xué)版),2008,29(1):12-16.

[8] 吳靜珠,劉翠玲,李 慧,等.基于近紅外光譜的純花生油慘偽快速鑒別方法研究[J].北京工商大學(xué)學(xué)報(自然科學(xué)版),2011,29(1):75-78.

[9] 翁欣欣,陸 峰,王傳現(xiàn),等.近紅外光譜-BP神經(jīng)網(wǎng)絡(luò)-PLS法用于橄欖油纏在分析[J].光譜學(xué)與光譜分析,2009,29(12):3283-3287.

[10] 吳靜珠,劉翠玲,李 慧,等.近紅外光譜技術(shù)在食用油種類鑒別及脂肪酸含量檢測中的應(yīng)用[J].北京工商大學(xué)學(xué)報(自然科學(xué)版),2010.09,25(5):56-59.

[11] 吳靜珠,徐 云.基于CARS-PLS的食用油脂肪酸近紅外定量分析模型的優(yōu)化[J].農(nóng)業(yè)機械學(xué)報,2011,42(10):162-166.

[12] 陳 建,陳 曉,李 偉,等.基于近紅外光譜技術(shù)和人工神經(jīng)網(wǎng)絡(luò)的玉米品種鑒別方法研究[J].光譜學(xué)與光譜分析,2008, 28(8).1806-1808.

[13] 羅一帆,郭振飛,朱振宇,等.近紅外光譜測定茶葉中茶多酚和茶多糖的人工神經(jīng)網(wǎng)絡(luò)模型研究[J].光譜學(xué)與光譜分析,2005, 25(8).1230-1233.

[14] 趙肖宇,關(guān) 勇,尚廷義,等.應(yīng)用近紅外透射光譜和人工神經(jīng)網(wǎng)絡(luò)的豆油脂良莠鑒別[J].浙江農(nóng)業(yè)學(xué)報,2011,23(4):825-828.

[15] 楊建剛.人工神經(jīng)網(wǎng)絡(luò)實用教程[M].杭州:浙江大學(xué)出版社,2001.

篇7

(一)樣本的選擇

本文選取房地產(chǎn)上市公司作為樣本以保證研究的真實性。鑒于我國上市公司鮮有破產(chǎn)的情況發(fā)生,本文采用證監(jiān)會的界定原則,將ST或者*ST(specialtreatment)公司定義為處于財務(wù)危機狀態(tài)的公司,將非ST公司界定為財務(wù)狀況正常的公司。

1.財務(wù)危機狀態(tài)樣本的界定

樣本來自于2005—2013年首次被ST或者*ST的34家房地產(chǎn)上市公司。選取的樣本研究期是上市公司被特殊處理時首次發(fā)生虧損的前一年(T-3年)。房地產(chǎn)企業(yè)投資回收期較長,虧損時有發(fā)生,在這一年以后接連發(fā)生虧損以至被特殊處理,因此這一年是上市公司發(fā)生財務(wù)危機的重要轉(zhuǎn)折點。

2.財務(wù)正常狀態(tài)樣本的選取原則

本研究針對的是房地產(chǎn)上市公司,界定未被特殊處理的房地產(chǎn)上市公司為財務(wù)狀況正常的樣本。為了排除政策等其他因素對研究的影響,選取的正常樣本研究期應(yīng)與發(fā)生財務(wù)危機的公司相同,據(jù)此本文最終選取了2005—2013年間34家房地產(chǎn)上市公司為財務(wù)狀況正常的樣本。

(二)預(yù)警指標(biāo)的選擇

由于財務(wù)危機的發(fā)生難以用幾個簡單的指標(biāo)來描述,同時又缺乏相關(guān)經(jīng)濟理論的指導(dǎo),造成了指標(biāo)選擇較為困難,本文采用試錯法對指標(biāo)進行篩選?;谌嫘院涂闪炕脑瓌t,結(jié)合我國房地產(chǎn)行業(yè)的特征,從企業(yè)的短期償債能力、現(xiàn)金流量能力、長期償債能力、營運能力、盈利能力、股東獲利能力、風(fēng)險水平和發(fā)展能力8個方面。過多的指標(biāo)存在著大量無用的信息,不僅會導(dǎo)致分析困難,而且會降低預(yù)測的準(zhǔn)確性。因此在進行分析之前,必須對備選指標(biāo)進行篩選,剔除對財務(wù)危機表現(xiàn)不顯著的指標(biāo)。

二、模型構(gòu)建與分析

(一)財務(wù)數(shù)據(jù)的預(yù)處理

在采集到的數(shù)據(jù)中,部分財務(wù)指標(biāo)缺乏,需要對這部分缺失的數(shù)據(jù)作一個預(yù)處理,保持數(shù)據(jù)的完整性,才能進行下一步的分析。對數(shù)據(jù)的預(yù)處理主要包括兩種情況:一是對于報表中未披露的數(shù)據(jù)。用該企業(yè)近期的數(shù)據(jù)作大致估計,盡量能代表公司的實際情況。二是對于不存在的指標(biāo)數(shù)據(jù)。比率型指標(biāo)當(dāng)分母為零時,該指標(biāo)不存在,為了保持數(shù)據(jù)的連續(xù)性,當(dāng)期指標(biāo)數(shù)據(jù)以其前后兩期的均值來代替。

(二)顯著性檢驗為了使分析更具有針對性

需要對上述備選指標(biāo)進行顯著性檢驗,選出有差異的指標(biāo)。對于分布不同的指標(biāo),采用不同的方法進行顯著性檢驗。

1.服從正態(tài)分布指標(biāo)的顯著性

檢驗利用SPSS軟件對上述備選指標(biāo)進行正態(tài)分布檢驗。檢驗結(jié)果顯示營運資金對資產(chǎn)總額比率、負債與權(quán)益市價比率、流動資金比率、營業(yè)成本率、賬面市值比5個指標(biāo)呈正態(tài)分布,其余指標(biāo)不符合正態(tài)分布。變量呈正態(tài)分布,對兩類樣本的相關(guān)指標(biāo)進行T檢驗,根據(jù)檢驗的結(jié)果判斷兩類樣本的預(yù)警指標(biāo)是否具有顯著性差異。本次T檢驗顯著性水平取值為0.05,在此顯著性水平下,營運資金對總資產(chǎn)比率和營業(yè)成本率通過顯著性檢驗,即這兩個指標(biāo)在兩類樣本中存在顯著差異。

2.不服從正態(tài)分布指標(biāo)的顯著性

檢驗其余57個指標(biāo)不服從正態(tài)分布,不能直接使用參數(shù)檢驗。非參數(shù)檢驗適用范圍廣,對數(shù)據(jù)要求也不嚴,但是容易造成信息的損失,檢驗效能低。為了保證信息的準(zhǔn)確性,先將數(shù)據(jù)進行轉(zhuǎn)化,利用轉(zhuǎn)化后的數(shù)據(jù)進行參數(shù)檢驗。轉(zhuǎn)化后的數(shù)據(jù)參數(shù)檢驗結(jié)果表明,流動比率、營運資金比率、長期資產(chǎn)適合率等25個指標(biāo)通過了顯著性水平為0.05的參數(shù)檢驗,在兩組樣本中差異顯著。

3.顯著性檢驗結(jié)果綜合以上兩種顯著性檢驗結(jié)果。

(三)因子分析較多的指標(biāo)會導(dǎo)致模型過度擬合

使得預(yù)測準(zhǔn)確度降低。對上述27個指標(biāo)進行因子分析,進一步減少指標(biāo)的數(shù)量。對剩下的指標(biāo)進行KMO測度和Bartlett球形檢驗。由上述檢驗結(jié)果可知KMO測度值為0.557,球形檢驗P值為0小于0.05,適合作因子分析。采用正交旋轉(zhuǎn)法進行轉(zhuǎn)換。結(jié)果顯示,特征值大于1的主成分有10個,累計貢獻率達84%,由正交旋轉(zhuǎn)成分矩陣可得:因子一主要代表盈利能力,因子二、因子八、因子十主要代表股東獲利能力,因子三和因子七主要代表長期償債能力,因子四和因子六主要代表短期償債能力,因子五主要代表營運能力,因子九主要代表風(fēng)險水平。

(四)模型構(gòu)建、預(yù)測結(jié)果及檢驗

1.BP神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建、預(yù)測結(jié)果及檢驗

BP神經(jīng)網(wǎng)絡(luò)模型主要由一個輸入層、一個輸出層、一個或多個隱含層構(gòu)成,每層節(jié)點的權(quán)值通過BP神經(jīng)網(wǎng)絡(luò)自我學(xué)習(xí)來調(diào)整,關(guān)于隱含層節(jié)點數(shù)的確定尚無相關(guān)理論,目前主要通過試錯法來確定。本次建模采用隱含層為一層的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),隱含層節(jié)點數(shù)由試錯法確定為4,從而得出BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為10-4-1。從每類樣本中隨機抽取20個作為建模組,剩余28個樣本作為驗證組,檢驗?zāi)P偷念A(yù)測效果。將建模組40個樣本的10個因子作為BP神經(jīng)網(wǎng)絡(luò)模型的輸入層作自我學(xué)習(xí)。模型自我學(xué)習(xí)完成之后,將剩余的28個測試樣本輸入經(jīng)學(xué)習(xí)樣本調(diào)適完成后的BP神經(jīng)網(wǎng)絡(luò)模型,得到的預(yù)測結(jié)果與實際結(jié)果比較。通過上述對比分析可知,BP人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測上市公司的財務(wù)狀況準(zhǔn)確率為85.7%,具有較高的準(zhǔn)確率。模型對于驗證組中兩類公司的預(yù)測準(zhǔn)確率相同。

2.Logistic模型構(gòu)建、預(yù)測結(jié)果及檢驗

將因子分析得到的10個因子用于Logistic回歸分析,令Y=0表示公司處于財務(wù)危機狀態(tài),Y=1表示公司處于正常狀態(tài),運行SPSS軟件,得到Logistic模型對40個建模樣本的判定分類。模型總體判定正確率為87.5%,其中對正常狀態(tài)公司的判定準(zhǔn)確率高達90%,由此判定模型的擬合度較好。Logistic模型的相關(guān)參數(shù)。模型參數(shù)中各參數(shù)的Sig值均大于0.05,對結(jié)果的影響均不顯著,建立的模型理論意義不大。求證其在實際預(yù)警中是否具有實用意義,將驗證組的24個樣本帶入模型得到的結(jié)果。對于驗證組的判定中雖然模型的理論意義不大,但在預(yù)測房地產(chǎn)上市公司是否處于財務(wù)危機狀態(tài)仍然有一定的實用意義,預(yù)測準(zhǔn)確率達到了67.86%,相較于神經(jīng)網(wǎng)絡(luò)模型準(zhǔn)確率較低,但是比神經(jīng)網(wǎng)絡(luò)模型更加容易理解,便于操作。

3.模型結(jié)果說明

上述兩種模型分別對驗證組進行了預(yù)測,對于一個房地產(chǎn)公司,兩種模型可能會給予不同的判定,因此對比了兩種模型對于驗證組的預(yù)測結(jié)果。驗證組中,有9家公司的BP神經(jīng)網(wǎng)絡(luò)模型和Logistic模型給出了互相矛盾的判斷,導(dǎo)致無法準(zhǔn)確判定這9家房地產(chǎn)上市公司的財務(wù)狀況。然而,當(dāng)BP神經(jīng)網(wǎng)絡(luò)模型和Logistic模型對同一房地產(chǎn)上市公司財務(wù)狀況的預(yù)測結(jié)果一致時,在驗證組中取得了89.47%的預(yù)測準(zhǔn)確率,有效提高了預(yù)測結(jié)果的準(zhǔn)確性。

三、結(jié)論

通過上文對房地產(chǎn)上市公司財務(wù)預(yù)警指標(biāo)體系的構(gòu)建及實證研究后發(fā)現(xiàn):

1.企業(yè)財務(wù)指標(biāo)選取越多,包含的財務(wù)信息也就越全面,降維處理時得出的因子會較多,幾個因子才能代表公司某一方面的能力。

2.對公司T-3年的財務(wù)狀況進行分析,兩類公司現(xiàn)金流量能力方面的指標(biāo)沒有顯著性區(qū)別,從現(xiàn)金流指標(biāo)無法判斷公司未來是否會處于財務(wù)危機狀況。

3.Logistic模型的參數(shù)對預(yù)測結(jié)果的影響都不顯著,證實財務(wù)危機是由多種因素共同作用所造成的,難以使用一種或幾種指標(biāo)來表明房地產(chǎn)上市公司發(fā)生了財務(wù)危機。

篇8

隨著科學(xué)技術(shù)的發(fā)展,現(xiàn)代設(shè)備的結(jié)構(gòu)日趨復(fù)雜,其故障類型越來越多,反映故障的狀態(tài)、特征也相應(yīng)增加。在實際故障診斷過程中,為了使診斷準(zhǔn)確可靠,總要采集盡可能多的樣本,以獲得足夠的故障信息。但樣本太多,會占用大量的存儲空間和計算時間,太多的特征輸入也會引起訓(xùn)練過程耗時費工,甚至妨礙訓(xùn)練網(wǎng)絡(luò)的收斂,最終影響分類精度。因此要從樣本中提取對診斷故障貢獻大的有用信息。這一工作就是特征提取。

特征提取就是利用已有特征參數(shù)構(gòu)造一個較低維數(shù)的特征空間,將原始特征中蘊含的有用信息映射到少數(shù)幾個特征上,忽略多余的不相干信息。從數(shù)學(xué)意義上講,就是對一個n維向量X=[x1,x2,…,xn]T進行降維,變換為低維向量Y=[y1,y2,…,ym]T,m<n。其中Y確實含有向量X的主要特性。

特征提取的方法有很多,常用的方法主要有歐式距離法、概率距離法、統(tǒng)計直方圖法、散度準(zhǔn)則法等。本文針對現(xiàn)有方法的局限性,研究基于BP神經(jīng)網(wǎng)絡(luò)的特征提取方法和基于互信息熵的特征提取方法。

1 基于BP神經(jīng)網(wǎng)絡(luò)的特征提取方法

要從N個特征中挑選出對診斷貢獻較大的n個特征參數(shù)(n<N),通常以特征參數(shù)X對狀態(tài)Y變化的靈敏度ε作為評價特征參數(shù)的度量:

εij=|(аYi)/(аXj)|

采用三層BP網(wǎng)絡(luò),輸入層n個單元對應(yīng)n個特征參數(shù),輸出層m個單元對應(yīng)m種模式分類,取中間隱層單元數(shù)為q,用W B iq表示輸入層單元i與隱層單元q之間的連接權(quán);用w O qj表示隱層單元q與輸出層單元j之間的連接權(quán),則隱層第q單元的輸出Oq,為:

輸出層第j個單元輸出yj為:

式中j=1,2,…,m;εj為閾值。

則特征參數(shù)xi對模式類別yj的靈敏度為:

代入(1)式,則特征參數(shù)Xi的靈敏度εij和特征參數(shù)Xk的靈敏度εkj之差可整理為:

大量的試驗和研究表明,當(dāng)網(wǎng)絡(luò)收斂后有:a1≈a2≈…≈aq。

從上式可以看出,如果:

則必有:εij>εki

即特征參數(shù)Xi對第j類故障的分類能力比特征參數(shù)Xk強。

將特征參數(shù)X和分類模式分類結(jié)果y組成的樣本集作為BP網(wǎng)絡(luò)的學(xué)習(xí)樣本,對網(wǎng)絡(luò)進行訓(xùn)練。設(shè)Wiq和Wkq分別為與特征參數(shù)Xi和Xk對應(yīng)輸入單元與隱層單元q之間的連接權(quán)系數(shù),記:

│Wεi│=│Wi1│+|Wi2|+…+|Wiq|

│Wεk│=│Wk1│+|Wk2|+…+|Wkq|

如果│Wεi│>│Wεk│,則可以認為Xi的特征靈敏度εi比特征參數(shù)Xk的靈敏度εk大。這樣可知特征參數(shù)Xi的分類能力比特征參數(shù)Xk的分類能力強。

2 基于互信息熵的特征提取方法

由信息特征可知,當(dāng)某特征獲得最大互信息熵,該特征就可獲得最大識別熵增量和最小誤識別概率,因而具有最優(yōu)特性。特征提取過程就是在由給定的n個特征集X二{XI~X2,…,zn)所構(gòu)成的初始特征集合情況下,尋找一個具有最大互信息熵的集合:X={X1,X2,…,Xk},k<n。由于最大互信息熵由系統(tǒng)熵和后驗熵決定,而系統(tǒng)熵是一定的,后驗熵越小,則互信息熵越大,分類效果越好。因此有效的特征提取就是在X給定后,尋找一個具有最大互信息熵或后驗熵的集合Y。即已知該域R上的初始特征集合X=[x1,x2,…,xn]T,尋找一個新的集合Y=[y1,y2,…,yk]T,k<n,使互信息熵最大,i=1,2,…,k。

在一定的初始特征集合下,識別樣本的后驗熵是一定的。在實現(xiàn)特征優(yōu)化過程中,隨著特征的刪除,會有信息的損失,使得后驗熵趨于增加。因此后驗熵增值大小反應(yīng)了刪除特征向量引起的信息損失的情況。當(dāng)刪除不同特征及刪除特征數(shù)逐步遞增時,會對應(yīng)有不同的后驗熵。按后驗熵由小到大排列,可獲得對應(yīng)的特征刪除序列。其過程可描述為:

(1)初始化:設(shè)原始特征集合F={N個特征},令初始優(yōu)化特征集合S=[K個特征,K=N];

(2)計算后驗熵;

(3)實現(xiàn)遞減:S=[K-1個特征],并計算相應(yīng)的后驗熵;

(4)選擇優(yōu)化特征集合:以多個遞減特征集合所對應(yīng)的后驗熵為依據(jù),選擇具有最小后驗熵增的特征向量集合為優(yōu)化特征集合S[N-1個優(yōu)化特征];

(5)返回(3),重新計算,直到滿足分類要求,選擇具有最小后驗熵的優(yōu)化特征集合;

(6)輸出優(yōu)化特征集合。

3 特征提取實例

在熱電廠的發(fā)電機組工作中,發(fā)電機組主軸經(jīng)常遇到如喘振、流體激勵等故障。這些故障不僅會引起生產(chǎn)效率下降,而且會對機器造成嚴重危害,影響機組的安全運行。傳統(tǒng)的診斷方法是在主軸軸承處加傳感器進行振動測試,得到其頻譜圖;然后在頻域內(nèi)分析,根據(jù)基于能量分布的故障診斷理論將振動信號功率譜密度按一定的規(guī)則進行量化,利用神經(jīng)網(wǎng)絡(luò)等工具進行故障診斷。但是喘振、流體激勵等故障在頻域內(nèi)通常表現(xiàn)為連續(xù)分布的有色噪聲帶,在頻域內(nèi)分析難以區(qū)分,難以進行頻譜特征提取,全息譜分析方法也不甚有效。傳統(tǒng)方法增加了系統(tǒng)的開銷,診斷效果不理想。如果在時域內(nèi)采用信息優(yōu)化方法做預(yù)處理,再用傳統(tǒng)的診斷方法進行診斷,可以收到很好的效果。

本文采用時域內(nèi)故障振動信號的方差、峭度、偏斜度等參數(shù),分別利用BP神經(jīng)網(wǎng)絡(luò)和后驗熵分析對其進行特征提取,研究如何從中找出最能反映故障的特征。

表1為主軸喘振、流體激勵故障時振動信號在垂直和水平方向的方差、峭度、偏斜度等6個參數(shù)的數(shù)據(jù)。

表1 主軸故障的特征參數(shù)

序號喘振流體激勵 均方差峭度偏斜度均方差峭度偏斜度 垂直水平垂直水平垂直水平垂直水平垂直水平垂直水平17.509.21-0.02-0.00-0.22-0.1040.244.10.22-0.42-0.11-0.08226.115.2-0.75-0.92-0.31-0.2170.120.53.821.780.000.16313.89.21-0.81-0.72-0.290.1912.414.2-0.38-0.620.030.0146.28.5-0.01-0.04-0.22-0.238.1533.50.15-0.140.070.10536.111.2-0.61-0.01-0.230.077.2115.2-0.41-0.510.010.01611.59.71-0.81-0.93-0.31-0.1825.730.2-0.370.19-0.11-0.06733.128.2-0.79-0.85-0.07-0.4571.225.33.811.850.010.16837.226.8-0.81-0.87-0.06-0.418.1135.2-0.81-0.130.010.11設(shè)原始特征集合F={x1,x2,x3,x4,x5,x6},其中x1、x2分別為垂直、水平方向的均方差,x3、x4分別為垂直和水平方向的峭度,x5、x6,分別為垂直和水平方向的偏斜度。

① 基于BP神經(jīng)網(wǎng)絡(luò)的特征提取方法:采用表1中的數(shù)據(jù)作為BP神經(jīng)網(wǎng)絡(luò)的輸入,編制程序?qū)ι窠?jīng)網(wǎng)絡(luò)進行訓(xùn)練,訓(xùn)練算法采用標(biāo)準(zhǔn)BP算法和Levenberg-Mar-quardt法兩種方法來訓(xùn)練BP網(wǎng)絡(luò),從而計算特征參數(shù)的特征靈敏度,確定出對結(jié)果影響最大的特征參數(shù)。

喘振:

│W1│={1.5874 1.6553 25.5320 25.1765 74.4724 40.4295}

流體激勵:

│W2│={1.5874 1.6553 25.5320 25.1765 74.4724 40.4295}

從結(jié)果可以看出:偏斜度對這兩種故障最為敏感,反映了低頻自激故障的主要特征。

② 基于互信息熵的特征提取方法:原始特征集合F={x1,x2,x3,x4,x5,x6}對應(yīng)表1中的特征參數(shù)。在特征參數(shù)優(yōu)化過程中,隨著特征的刪除,后驗熵變化較大。當(dāng)刪除的特征中包含有x5、x6時,后驗熵明顯降低;如僅保留x5、x6時,后驗熵最小。說明偏斜度對這兩種故障最為敏感。

篇9

關(guān)鍵詞: 供應(yīng)鏈績效評價;模糊綜合評估;粗糙集;BP神經(jīng)網(wǎng)絡(luò)

中圖分類號:C93 文獻標(biāo)識碼: A文章編號:1003-7217(2011)05-0119-06

一、引 言

在供應(yīng)鏈條件下,各節(jié)點企業(yè)運作行為往往具有隨機性和不確定性。動態(tài)供應(yīng)鏈績效評價是一個包含多個指標(biāo)和輸入輸出的復(fù)雜評估系統(tǒng),各績效指標(biāo)具有模糊性、不確定性,彼此之間存在非線性關(guān)聯(lián)性。軟計算[1-7]理論與方法是處理動態(tài)供應(yīng)鏈績效這樣復(fù)雜的、具有大量不確定性和模糊性的評估系統(tǒng)的重要技術(shù)。在相當(dāng)多的領(lǐng)域(自然科學(xué)、社會科學(xué)與工程技術(shù))中,都涉及到對不完備信息和不確定因素的處理。從實際系統(tǒng)中采集到的數(shù)據(jù)常常包含著噪聲、不精確甚至不完整,如果我們采用純數(shù)學(xué)上的假設(shè)來消除或回避這種不確定性,效果往往不理想。但如果對這種信息使用恰當(dāng)?shù)姆绞竭M行處理,常常有助于實際系統(tǒng)問題的解決。

二、相關(guān)研究評述

多年來,研究人員一直在努力尋找科學(xué)地處理不完整性和不確定性的有效途徑,實踐證明,1965年Zadeh[8]創(chuàng)立的模糊集理論與1982年P(guān)awlak[9]倡導(dǎo)的粗糙集理論是處理不確定性的兩種很好的方法。事實上,除了上述兩種方法外,基于概率統(tǒng)計方法的證據(jù)理論也是處理不確定性的一種有效方法。以上眾多的方法都屬于軟計算[10-15](Soft Computing)的范疇。Zadeh教授提出了軟計算的概念,軟計算的主要工具包括粗糙集、模糊邏輯(Fuzzy Logic)、神經(jīng)網(wǎng)絡(luò)、概率推理(Probability Reasoning)、信任度網(wǎng)絡(luò)(Belief Network)、遺傳算法(Genetic Arithmetic)、混沌理論(Chaos)等。傳統(tǒng)的計算方法,即所謂的硬計算(Hard Computing),使用精確、固定和不變的算法來表達和解決問題,軟計算利用所允許的不精確性、不確定性和部分真實性得到易于處理、魯棒性強和成本較低的解決方案,以便更好地與現(xiàn)實系統(tǒng)相協(xié)調(diào)。因此,軟計算作為知識獲取和智能信息處理的重要手段,在許多研究領(lǐng)域有著廣泛而深入的應(yīng)用。

(一)基于模糊綜合評估的供應(yīng)鏈績效評價

模糊集理論是經(jīng)典理論的推廣,它認為元素總是以一定的程度屬于某個集合, 也可能以不同的程度屬于幾個集合。經(jīng)典理論中集合的邊界是清晰的,而模糊集理論中集合的邊界是不清晰的,對人們顯示生活中大量使用的一些含義確定但不準(zhǔn)確的語言表述,模糊數(shù)學(xué)可以較好地表達,因而可以自然地用于事物的評價。

在動態(tài)供應(yīng)鏈績效評價體系中,各績效指標(biāo)之間往往存在著復(fù)雜的因果關(guān)系,這些指標(biāo)中既有定性指標(biāo)也有定量指標(biāo),具有模糊和不確定的特點,模糊綜合評估方法為處理這種不確定性提供了有力的工具,它能夠盡可能地減少個人主觀臆斷所帶來的危害,為合理評價決策提供科學(xué)的依據(jù)。作者在文獻[16]中詳細討論了基于模糊綜合分析的供應(yīng)鏈績效評價方法,并結(jié)合Markov鏈預(yù)測理論給出了供應(yīng)鏈績效未來的發(fā)展趨勢。

(二)基于粗糙集約簡的供應(yīng)鏈績效評價

Rough集理論是一種刻畫含噪聲、不完整、不精確、不相容的數(shù)學(xué)工具,它能有效分析和處理不精確、不一致、不完整等各種不完備信息,并從中發(fā)現(xiàn)隱含的知識,揭示潛在的規(guī)律,是一種重要的軟計算技術(shù)。其主要思想是在保持分類能力不變的前提下,通過知識約簡,導(dǎo)出概念的分類原則。Rough 集理論是基于不可分辨的思想和知識簡化的方法,從數(shù)據(jù)中推理邏輯規(guī)則作為知識系統(tǒng)模型。

如前所述,在供應(yīng)鏈條件下,各節(jié)點企業(yè)運作策略具有動態(tài)可調(diào)節(jié)性,其運作行為具有隨機性和不確定性,這就要求在對供應(yīng)鏈績效進行評價必須采用動態(tài)評價方法,同時對供應(yīng)鏈在未來某一時刻的整體績效進行預(yù)測。粗糙集及其約簡理論是處理這種不確定性的重要技術(shù)。作者在文獻[17]中基于粗糙集理論的績效評價模型,建立了動態(tài)供應(yīng)鏈績效評價決策表,利用粗糙集約簡方法得到了預(yù)測績效評價結(jié)果的決策規(guī)則集,并把粗糙集約簡和模糊綜合評估技術(shù)相結(jié)合進行動態(tài)供應(yīng)鏈績效評價,顯然地縮小了數(shù)據(jù)處理的規(guī)模,降低了模型的計算復(fù)雜度。

(三)基于神經(jīng)網(wǎng)絡(luò)的供應(yīng)鏈績效評價

神經(jīng)網(wǎng)絡(luò)可大規(guī)模地并行處理和分布式地存儲信息,具有良好的自適應(yīng)、自組織性以及很強的學(xué)習(xí)功能、聯(lián)想功能和容錯功能。與當(dāng)今的馮諾依曼式計算機相比,更加接近人腦的信息處理模式,主要表現(xiàn)為能夠處理連續(xù)的模擬信號。神經(jīng)網(wǎng)絡(luò)并行分布工作,各組成部分同時參與運算,單個神經(jīng)元的動作速度不高,但總體的處理速度很快。神經(jīng)網(wǎng)絡(luò)信息存儲分布于全網(wǎng)絡(luò)各個權(quán)重變換之中,某些單元障礙并不影響信息的完整。傳統(tǒng)計算機要求有準(zhǔn)確的輸入條件, 才能給出精確解。神經(jīng)網(wǎng)絡(luò)只要求部分條件,甚至對于包含有部分錯誤的輸入,也能得出較好的解答,因此具有較好的容錯性。

動態(tài)供應(yīng)鏈績效評價是一個包含多個指標(biāo)輸入輸出的復(fù)雜評估系統(tǒng),各績效指標(biāo)具有模糊性,彼此之間存在非線性關(guān)聯(lián)性。針對這樣一個復(fù)雜的評估系統(tǒng),作者曾利用BP神經(jīng)網(wǎng)絡(luò)技術(shù)來找出供應(yīng)鏈績效評價系統(tǒng)輸入-輸出之間的非線性映射關(guān)系,從而對動態(tài)供應(yīng)鏈績效評價結(jié)果進行學(xué)習(xí)和預(yù)測。通過與粗糙集約簡理論相結(jié)合,簡化了BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計,減小了運算量。

(四)幾種軟計算方法的優(yōu)缺點

軟計算是一個方法的集合體,目前主要包括粗糙集、模糊邏輯、神經(jīng)網(wǎng)絡(luò)、概率推理、信任度網(wǎng)絡(luò)、遺傳算法以及混沌理論等。軟計算方法已廣泛應(yīng)用于包括模式識別、數(shù)據(jù)挖掘、系統(tǒng)評價、故障診斷、專家系統(tǒng)等在內(nèi)的諸多領(lǐng)域的不精確、不確定問題。軟計算方法按照其特點各有優(yōu)勢。例如,模糊集可以通過對人類思維建模來給不確定性問題提供自然的解決機制;粗糙集在屬性約簡和規(guī)則抽取方面性能優(yōu)良;神經(jīng)網(wǎng)絡(luò)對噪聲具有強魯棒性,分類精度高;遺傳算法廣泛用于優(yōu)化搜索問題。 同時,以上軟計算方法依照算法的不同有各自的局限性:模糊集過度依賴專家知識,遺傳算法收斂速度慢、穩(wěn)定性差,神經(jīng)網(wǎng)絡(luò)訓(xùn)練時間過長、知識解釋性差,而粗糙集對數(shù)據(jù)中的噪聲較敏感。本文為了克服單一方法的局限,試圖通過集成兩種或兩種以上的軟計算方法的軟計算融合系統(tǒng)來解決供應(yīng)鏈績效評價的實際問題[6, 7]。

財經(jīng)理論與實踐(雙月刊)2011年第5期2011年第5期(總第173期)鄭 培,萬 煒:基于智能信息處理的供應(yīng)鏈績效評價方法

(五)軟計算融合技術(shù)在動態(tài)供應(yīng)鏈績效評價中的應(yīng)用

作者詳細研究了模糊綜合分析、粗糙集理論、神經(jīng)網(wǎng)絡(luò)等軟計算技術(shù)在動態(tài)供應(yīng)鏈績效評價中的應(yīng)用方法。從文獻[16-17]實驗結(jié)果可以初步看出,通過把幾種軟計算技術(shù)融合起來應(yīng)用于供應(yīng)鏈績效評價,就能夠克服單一智能信息處理方法的缺陷,取得更好的效果。本文使用的幾種軟計算技術(shù)能在多個方面進行融合[6, 7]。

粗糙集和神經(jīng)網(wǎng)絡(luò)的融合。通過粗糙集的屬性約簡可以顯著減少原始數(shù)據(jù)量,使神經(jīng)網(wǎng)絡(luò)訓(xùn)練時間縮短,從訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)中抽取規(guī)則也可顯著提高神經(jīng)網(wǎng)絡(luò)中知識可理解性;神經(jīng)網(wǎng)絡(luò)的強魯棒性也可解決粗糙集處理數(shù)據(jù)中的噪聲問題。

粗糙集理論和模糊集理論的融合。粗糙集理論和模糊集理論都是研究信息系統(tǒng)中知識不完善、不精確問題的方法,但粗糙集理論解決問題的出發(fā)點是信息系統(tǒng)中知識的不可分辨性,而模糊集理論則關(guān)注信息系統(tǒng)中知識的模糊性,兩者在處理方法上各有特色。兩者的結(jié)合可以更好地解決信息系統(tǒng)中不完善、不精確性知識的問題。

模糊集和神經(jīng)網(wǎng)絡(luò)的融合。模糊集和神經(jīng)網(wǎng)絡(luò)的融合主要有模糊神經(jīng)網(wǎng)絡(luò)和神經(jīng)模糊系統(tǒng)。神經(jīng)模糊系統(tǒng)以神經(jīng)網(wǎng)絡(luò)為主,結(jié)合模糊集理論,將神經(jīng)網(wǎng)絡(luò)作為實現(xiàn)模糊模型的工具,即在神經(jīng)網(wǎng)絡(luò)的框架下實現(xiàn)模糊系統(tǒng)或其一部分功能。從結(jié)構(gòu)上看,一般是四層或五層的前向神經(jīng)網(wǎng)絡(luò)。模糊神經(jīng)網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)的模糊化,即以模糊集、模糊邏輯為主,結(jié)合神經(jīng)網(wǎng)絡(luò)方法,利用神經(jīng)網(wǎng)絡(luò)的自組織性,達到柔性信息處理的目的。

三、基于智能信息處理的供應(yīng)鏈績效評價方法比較

(一)基本思路

在作者以前的研究里,曾應(yīng)用模糊綜合分析、粗糙集理論和BP神經(jīng)網(wǎng)絡(luò)等智能信息處理方法建立了多個供應(yīng)鏈績效評價模型,本文對這些評價模型的效果和優(yōu)缺點進行了分析和總結(jié)。我們的基本思路是以某動態(tài)供應(yīng)鏈為例,選取合適的績效指標(biāo)集,對得到的績效指標(biāo)按照評價模型的數(shù)據(jù)要求進行預(yù)處理,然后輸入到不同的動態(tài)績效評價模型中進行處理,對各個績效評價模型進行解算。通過對模型輸出的結(jié)果的比較和分析來歸納各個績效評價模型的主要特點,并對評價模型的實際效果進行總結(jié)。

(二)數(shù)據(jù)預(yù)處理

如前所述,本文已經(jīng)根據(jù)文獻[15]提出的供應(yīng)鏈五維平衡計分卡,選擇了15個關(guān)鍵績效指標(biāo)作為動態(tài)供應(yīng)鏈的績效評價指標(biāo)集C,C={F1, F2, F3, C1, C2, C3, P1, P2, P3, P4, L1, L2, L3, S1, S2}。在15個績效指標(biāo)中,既有定性指標(biāo),也有定量指標(biāo)。由于BP神經(jīng)網(wǎng)絡(luò)只能處理數(shù)值向量,因此在這些績效指標(biāo)輸入BP網(wǎng)絡(luò)訓(xùn)練之前必須對它們進行預(yù)處理。在基于粗糙集理論的供應(yīng)鏈績效評價模型里,根據(jù)決策表信息約簡的要求,需要對所有屬性的取值進行離散化處理。這里對某動態(tài)聯(lián)盟供應(yīng)鏈績效決策表條件屬性采用表1的方法進行離散化處理。

假設(shè)根據(jù)歷史經(jīng)驗或供應(yīng)鏈行規(guī),把供應(yīng)鏈的績效評價結(jié)果劃分為G1、G2、G3、G4四個等級,分別對應(yīng)供應(yīng)鏈績效評價為優(yōu)、良、中、差的狀態(tài),其劃分的依據(jù)如表1所示。

在基于模糊綜合評估的供應(yīng)鏈績效評價模型里,表1將作為構(gòu)造各績效指標(biāo)屬于各類的隸屬度函數(shù)的依據(jù)。

(三)實驗結(jié)果比較與分析

實驗的數(shù)據(jù)源仍采用文獻[15]某供應(yīng)鏈相關(guān)指標(biāo)的調(diào)查結(jié)果,經(jīng)調(diào)查得到該供應(yīng)鏈在2007年1~12個月的績效指標(biāo)取值和績效綜合評價結(jié)果。本文已經(jīng)詳細討論了對該供應(yīng)鏈績效采用基于BP網(wǎng)絡(luò)訓(xùn)練和學(xué)習(xí)的過程,并結(jié)合粗糙集約簡給出兩者相結(jié)合的混合績效評價方法及結(jié)果。

BP網(wǎng)絡(luò)學(xué)習(xí)完畢后,就可以用來對下一評估時刻的供應(yīng)鏈績效進行預(yù)測。針對上述供應(yīng)鏈,經(jīng)調(diào)查得到該供應(yīng)鏈在2008年前4個月的績效指標(biāo)取值結(jié)果,如表2所示。

將上述各績效指標(biāo)規(guī)一化后輸入訓(xùn)練好的BP網(wǎng)絡(luò),得到相應(yīng)的輸出向量分別為(0.0023, 0.998, -0.002, 0.007)、(-0.008, 0.003, 0.988, -0.005)、(-0.008, 0.958, -0.008, -0.002)和(0.987, -0.010, -0.005, 0.005)。據(jù)此可判斷該供應(yīng)鏈在2008年1~4月的績效綜合評價結(jié)果分別為G2、G3、G2、G1。

進一步,針對表1所示的供應(yīng)鏈績效分級標(biāo)準(zhǔn),可以通過Rough約簡得到供應(yīng)鏈績效分級決策表的最佳約簡,即供應(yīng)鏈績效評價的關(guān)鍵績效指標(biāo)集。通過約簡得到供應(yīng)鏈績效評價的關(guān)鍵指標(biāo)集為{F1, F2, F3, C1, C2, P1, P2, P3, L1, L2, L3, S1},這樣這12個關(guān)鍵績效指標(biāo)就構(gòu)成了BP網(wǎng)絡(luò)的輸入層節(jié)點。把表2所示的供應(yīng)鏈在2008年1~4月的關(guān)鍵績效指標(biāo)量化結(jié)果輸入訓(xùn)練好的BP網(wǎng)絡(luò),可求出其相應(yīng)的績效評價結(jié)果分別為G2、G3、G2、G1,與供應(yīng)鏈績效實際調(diào)查結(jié)果一致。

下面,針對同一供應(yīng)鏈,分別采用基于粗糙集理論的動態(tài)供應(yīng)鏈績效評價模型、基于模糊綜合評估的供應(yīng)鏈績效評價模型及兩者的結(jié)合來得出供應(yīng)鏈績效評價結(jié)果,并進行方法間的比較。

在基于粗糙集理論的供應(yīng)鏈績效評價模型里,先對各績效指標(biāo)進行離散化處理,離散化后的該動態(tài)供應(yīng)鏈績效決策表如下。

對于表3所示的績效評價決策表,利用約簡算法對決策表進行屬性約簡,以便去掉決策表的冗余條件屬性。進一步,利用歸納值約簡算法對績效決策表進行值約簡,可以得到一系列用于供應(yīng)鏈績效評價的決策規(guī)則集。由于決策屬性值被離散化為四個等級,亦即信息系統(tǒng)具有四個概念。針對這四個概念的最一般規(guī)則分別為:

根據(jù)上述關(guān)于決策屬性取值的最一般規(guī)則,就可以對某一考察周期動態(tài)聯(lián)盟的綜合績效評價結(jié)果作出判斷。當(dāng)條件屬性集不完全滿足規(guī)則前件時,可以選取關(guān)于各個概念的次一般(或可信度較高)的生成式規(guī)則對績效作出綜合評估。

把表2所示的該供應(yīng)鏈在2008年前4個月的績效指標(biāo)離散化,然后針對上述供應(yīng)鏈績效評價決策規(guī)則進行匹配,可得這4個月供應(yīng)鏈績效綜合評價結(jié)果分別為G3、G3、G2、G1。

接著,采用模糊綜合評估方法來對同一供應(yīng)鏈的績效評價結(jié)果進行分析。首先建立模糊關(guān)系矩陣,單因素評價矩陣取各因素在評價集上的隸屬度,各隸屬度函數(shù)均取為二次函數(shù)。根據(jù)供應(yīng)鏈績效分類標(biāo)準(zhǔn)表1,建立F1屬于各類的隸屬度函數(shù)為:

同理,可分別建立其它績效指標(biāo)屬于各類的隸屬度函數(shù),對應(yīng)績效評價指標(biāo)集C的權(quán)向量取為:

W=(0.17,0.06,0.02,0.08,0.13,0.02,0.05,0.04,0.10,0.01,0.10,0.04,0.05,0.11,0.02)

于是,由模糊綜合評估法可求出該供應(yīng)鏈在2008年前4個月的績效分別為G3、G3、G2、G1。

最后,采用結(jié)合了粗糙集約簡和模糊綜合評估的動態(tài)供應(yīng)鏈績效評價方法來得到該供應(yīng)鏈績效評價結(jié)果。首先借助于動態(tài)供應(yīng)鏈績效評價決策表對績效評價指標(biāo)進行約簡和降維,通過Rough約簡得到供應(yīng)鏈績效評價的關(guān)鍵績效指標(biāo)集為{F1, F2, F3, C1, C2, P1, P2, P3, L1, L2, L3, S1},根據(jù)供應(yīng)鏈績效分類標(biāo)準(zhǔn)表2分別建立上述關(guān)鍵績效指標(biāo)屬于各類的隸屬度函數(shù),然后利用模糊評估方法對供應(yīng)鏈績效進行綜合評價。根據(jù)該混合供應(yīng)鏈績效評價方法求出該供應(yīng)鏈在2008年前4個月的績效分別為G2、G3、G3、G1。

我們給出了采用上述五種基于智能信息處理的績效評價方法得到的該供應(yīng)鏈在2007年1月~2008年4月間績效評價結(jié)果的變化趨勢,如圖1所示。其中,如圖例所示圓圈、方塊實線、下三角實線、粗標(biāo)圓卷實線和帶星虛線分別代表了對應(yīng)月份由五種評估方法得到的供應(yīng)鏈績效評價結(jié)果。

圖1 某供應(yīng)鏈采用五種績效綜合評估方法得到的評價結(jié)果

從圖1可以看出,采用五種不同的供應(yīng)鏈績效評價方法得到的結(jié)果略有差異。這一差異由多種原因引起,首先基于BP神經(jīng)網(wǎng)絡(luò)的績效評價方法和基于粗糙集理論的績效評價方法都是有監(jiān)督的智能學(xué)習(xí)算法,即在對動態(tài)供應(yīng)鏈績效評價結(jié)果作出預(yù)測之前,都有個訓(xùn)練的過程,這需要大量的歷史數(shù)據(jù)。而基于模糊綜合評估的供應(yīng)鏈績效評價方法隸屬度函數(shù)主要由績效分級標(biāo)準(zhǔn)確定,并不“顯式”地需要歷史績效結(jié)果。其次,許多基于智能信息處理的績效評價模型都需要事先確定一些參數(shù),如BP網(wǎng)絡(luò)需要確定網(wǎng)絡(luò)結(jié)構(gòu)、學(xué)習(xí)速率、沖量因子;模糊綜合評估需要確定指標(biāo)權(quán)值和隸屬度函數(shù)表示方法等。另外,不同的績效評價模型對輸入數(shù)據(jù)的要求各不相同,BP神經(jīng)網(wǎng)絡(luò)和模糊綜合評估處理的是連續(xù)數(shù)據(jù),粗糙集約簡處理的是離散數(shù)據(jù),而實際獲得的績效指標(biāo)中既有定性指標(biāo),也有定量指標(biāo),這就需要在績效指標(biāo)輸入模型之前進行預(yù)處理,預(yù)處理方法的不同導(dǎo)致模型輸出有很大的差異。上述幾種不同的基于智能信息處理的供應(yīng)鏈績效評價方法輸出結(jié)果與供應(yīng)鏈實際績效基本相符,在實際使用時要根據(jù)情況靈活選擇。

此外,實驗結(jié)果也表明通過幾種智能信息處理方法融合在動態(tài)供應(yīng)鏈績效評價中能取得更好的效果。通過粗糙集約簡和模糊綜合評估的融合,顯然縮小了數(shù)據(jù)處理的規(guī)模,降低了評估模型的計算復(fù)雜度,同時克服了模糊評估過度依賴專家知識(領(lǐng)域知識)的缺點。通過粗糙集約簡和BP神經(jīng)網(wǎng)絡(luò)的融合,降低BP網(wǎng)絡(luò)的設(shè)計復(fù)雜度,克服了神經(jīng)網(wǎng)絡(luò)訓(xùn)練時間長、知識解釋性較差的缺點。兩種融合方法都保持了較高的準(zhǔn)確度,在動態(tài)供應(yīng)鏈績效評價中更為有效。

本文的研究結(jié)果彌補了目前國內(nèi)外動態(tài)供應(yīng)鏈績效評價中智能信息處理方法的融合理論研究少、應(yīng)用不夠深入的缺點,對實際供應(yīng)鏈運作與管理中基于軟計算的動態(tài)績效評價模型和方法的選擇與應(yīng)用具有理論指導(dǎo)意義。

四、結(jié) 論

軟計算作為知識獲取和智能信息處理的重要手段,在供應(yīng)鏈績效評價領(lǐng)域有著良好的應(yīng)用前景。越來越多的學(xué)者開始集成兩種或兩種以上的軟計算方法的智能信息融合算法來克服單一方法的局限性。本文針對之前使用的模糊綜合評估、粗糙集約簡及BP神經(jīng)網(wǎng)絡(luò)等軟計算方法在動態(tài)供應(yīng)鏈績效評價中的主要特點和效果進行了簡要的比較和分析,指出了每種方法的優(yōu)缺點。然而,由于每種智能信息處理方法存在著本質(zhì)上的差異,對這些方法間的效果差異進行嚴格的比較存在理論上的困難。某種智能信息處理方法可能適用于某種供應(yīng)鏈,而另一種智能信息處理方法則可能更適用于另一種供應(yīng)鏈。因此,在實際使用時,要根據(jù)供應(yīng)鏈具體情況靈活選擇或融合多種智能信息處理方法以取得更好的效果。

參考文獻:

[1]Anna, M. R. and Etienne, E. K. A comparative study of fuzzy rough sets[J]. Fuzzy Sets and System, 2002 ,126(2): 137-155.

[2]Nagatanit, Helbingd. Stability analysis and stabilization strategies for linear supply chains.[J].Physica A., 2004, 35 (3-4): 644-660.

[3]Mohamed. Q. A-RST: a generation of rough set theory[J]. Information Science, 2000 ,124(1-4): 301-316.

[4]Roman, W. S., Larry, H. Rough sets as a front end of neuraln-etworks texture classifiers[J]. Neurocomputing, 2001, 36: 85-102.

[5]Yahia, M. E., Mahmod R. and N. Sulaiman, et al. Rough neural expert systems[J]. Expert Systems with Applications. 2002, 18: 87-99.

[6]McKee, T. E., Terje, L. Genetic programming and rough sets: a hybrid approach to bankruptcy classification[J]. European Journal of Operational Research, 2002 ,138: 436-451.

[7]Bolch G., Greine, S., H. D. Meer, etc. Queuing networks and markov chains-modeling and performance evaluation with computer science applications (2nd edition)[M]. A John Wiley & Sons, Inc., publication, 2006.

[8]Zadeh L. A. Fuzzy sets[J]. Information and Control. 1965, 8 (3): 338-353.

[9]Pawlak, Z. Rough set-theoretical aspects of reasoning about data [M]. Boston: MA: Kluwer Academic Publishers, 1991.

[10]曹慶奎,阮俊虎.基于粗糙集-未確知測度的礦井通風(fēng)系統(tǒng)合理性評價[J].科學(xué)決策,2009.5:89-94.

[11]劉敬學(xué),陳曦. 基于神經(jīng)網(wǎng)絡(luò)的專家預(yù)測方法研究[J].科學(xué)決策,2009,11:78-81.

[12]Bhagwat and Sharma.Management of information system in SMEs: an exploratory study. [J].International Journal of Enterprise and Network Management. 2006,1(1): 99-125.

[13]Bititici et al..Implementation of performance measurement systems:private and public sectors[J]. Editorial, Production Planning and Control. 2005,16(2):99-100.

[14]鄭培,黎建強. 基于BP神經(jīng)網(wǎng)絡(luò)的供應(yīng)鏈績效評價方法[J].運籌與管理,2010,19(2):26-32.

[15]宋莎莎,戴鋒,衛(wèi)保璐.基于模糊層次分析法和聚類分析的突發(fā)事件分級研究[J].科學(xué)決策,2010,10:68-72.

[16]鄭培,黎建強. 基于模糊評估和馬爾可夫預(yù)測的供應(yīng)鏈動態(tài)平衡記分卡研究 [J]. 系統(tǒng)工程理論與實踐,2008,4(4): 57-64.

[17]鄭培,黎建強. 基于粗糙集理論的供應(yīng)鏈動態(tài)績效評估方法研究 [J]. 運籌與管理,2008,10(5):6-11.

[18]王俊峰,劉立東.基于博弈論的閉環(huán)供應(yīng)鏈中三方協(xié)調(diào)研究[J].科學(xué)決策,2009,(3):33-37.

Supply Chain Performance Measurement Methods based on Intelligent Information Processing

ZHENG Pei 1, WAN Wei2

(College of Business Administration, Hunan University, Changsha Hunan 410082, China)

篇10

關(guān)鍵詞: 電力系統(tǒng); 短期負荷; 野草算法; 相空間重構(gòu)

中圖分類號: TN915?34; TP391 文獻標(biāo)識碼: A 文章編號: 1004?373X(2016)19?0099?03

Abstract: The short?term load has the chaos characteristic due to the comprehensive influence of weather and seasons. In order to describe the change trend of short?load accurately and improve the prediction accuracy, a short?term load forecasting model fusing weed algorithm with support vector machine (WA?SVM) is proposed. A large number of short?term load historical data is collected, and performed with the chaotic analysis and processing to establish the training and testing data sets of support vector machine. And then the support vector machine is used to establish the short?term load forecasting model, and the weed algorithm is used to find out the optimal parameters of support vector machine. The performance of the short?term load forecasting was tested with simulation contrast experiment. The results show that the short?term load forecasting accuracy of WA?SVM model is higher than that of other models, and this model provides a new research method for short term load modeling and forecasting.

Keywords: electric power system; short?term load; weed algorithm; phase space reconstruction

0 引 言

隨著經(jīng)濟不斷發(fā)展,電力系統(tǒng)在許多領(lǐng)域越來越重要,為了準(zhǔn)確、有效地管理電力系統(tǒng),電力負荷是其中一種重要手段。負荷預(yù)測是對歷史數(shù)據(jù)進行分析,找到負荷變化趨勢,以便于對電力系統(tǒng)進行相應(yīng)的管理,短期負荷預(yù)測的實際應(yīng)用性強,因此提高短期負荷預(yù)測的精度已成為電力系統(tǒng)研究中的一個熱點問題[1]。

當(dāng)前短期負荷預(yù)測模型劃分為線性模型和非線性模型[2]。線性模型假設(shè)短期負荷呈線性趨勢變化,主要采用時間序列方法[3?4],其易實現(xiàn)、結(jié)果解釋性好。但負荷受到多種因素影響,變化十分復(fù)雜,具有時變性、非線性,時間序列方法無法捕捉到負荷數(shù)據(jù)隱含的變化趨勢,預(yù)測結(jié)果不理想[5]。非線性模型有神經(jīng)網(wǎng)絡(luò)、支持向量機(Support Vector Machine,SVM)等,相對于線性模型,它們可以更好地擬合短期負荷變化特征,獲得更高的短期負荷預(yù)測精度[6?7]。但在短期負荷的建模與預(yù)測中,非線性模型同樣有不足,如神經(jīng)網(wǎng)絡(luò)存在收斂速度慢、過擬合[8];SVM參數(shù)直接影響到短期負荷預(yù)測精度[9],為了獲得更優(yōu)的SVM參數(shù),當(dāng)前采用網(wǎng)格搜索法、遺傳算法等進行SVM參數(shù)尋優(yōu),但在實際應(yīng)用過程中,網(wǎng)格搜索法執(zhí)行時間長、遺傳算法尋優(yōu)結(jié)果不穩(wěn)定[10]。同時短期負荷具有一定的混沌性,建模時需要對數(shù)據(jù)進行混沌分析和處理[11]。

為了準(zhǔn)確描述短期負荷變化趨勢,以提高預(yù)測精度,提出一種野草算法和支持向量機相融合的短期負荷預(yù)測模型(WA?SVM)。首先對短期負荷歷史數(shù)據(jù)進行混沌分析和處理,然后采用野草算法和支持向量機建立短期負荷預(yù)測模型,最后進行短期負荷預(yù)測仿真實驗,對模型預(yù)測性能進行驗證。

1 支持向量機和野草算法

4 結(jié) 語

短期負荷具有不確定性與復(fù)雜性,為了獲得更高精度的短期負荷預(yù)測結(jié)果,提出一種WA?SVM的短期負荷預(yù)測模型,并與其他模型進行了對比分析,測試了WA?SVM進行短期電力負荷預(yù)測的有效性和優(yōu)越性,結(jié)果表明,WA?SVM準(zhǔn)確地描述了短期負荷變化趨勢,獲得了比對比模型更優(yōu)的短期負荷預(yù)測的結(jié)果,而且訓(xùn)練時間更少,在電力管理領(lǐng)域中具有廣泛的應(yīng)用前景。

參考文獻

[1] 魏偉,牛東曉,.負荷預(yù)測技術(shù)的新進展[J].華北電力大學(xué)學(xué)報,2002,29(1):10?15.

[2] KELO S M, DUDUL S V. Short?term Maharashtra state electrical power load prediction with special emphasis on seasonal changes using a novel focused time lagged recurrent neural network based on time delay neural network model [J]. Expert systems with applications, 2011, 38(3): 1554?1564.

[3] 劉晶,朱鋒峰,林輝,等.基于相似日負荷修正算法的短期負荷預(yù)測[J].計算機工程與設(shè)計,2010,31(6):1279?1282.

[4] 王繼選,劉小貞,韓中合.基于多約束條件的電力負荷預(yù)測模型的研究[J].華東電力,2013,41(3):643?645.

[5] 王勇,黃國興,彭道剛.帶反饋的多元線性回歸法在電力負荷預(yù)測中的應(yīng)用[J].計算機應(yīng)用與軟件,2008,25(1):83?84.

[6] 郭新辰,王雪峰,馮英浚.采用神經(jīng)網(wǎng)絡(luò)進行電力系統(tǒng)短期負荷預(yù)測的一種降維方法[J].華北電力學(xué)院學(xué)報,2002,22(2):24?28.

[7] 程玉桂,黎明,林明玉.基于遺傳算法和BP神經(jīng)網(wǎng)絡(luò)的城區(qū)中長期電力負荷預(yù)測與分析[J].計算機應(yīng)用,2010,30(1):224?226.

[8] 翟永杰,周倩,韓璞.EMD?ISMO算法在電力負荷預(yù)測中的應(yīng)用[J].系統(tǒng)仿真學(xué)報,2010,22(12):2858?2861.

[9] 楊延西,劉丁.基于小波變換和最小二乘支持向量機的短期電力負荷預(yù)測閉[J].電網(wǎng)技術(shù),2005,29(13):60?64.

[10] 姜惠蘭,劉曉津,關(guān)穎,等.基于硬C均值聚類算法和支持向量機的電力系統(tǒng)短期負荷預(yù)測[J].電網(wǎng)技術(shù),2006,30(8):81?85.

[11] 權(quán)先珍,蔣傳文,張勇傳.電力負荷的混沌預(yù)測方法[J].華中理工大學(xué)學(xué)報,2000,28(7):92?94.