前言:本站為你精心整理了多元線性回歸下環(huán)境監(jiān)測(cè)數(shù)據(jù)分析范文,希望能為你的創(chuàng)作提供參考價(jià)值,我們的客服老師可以幫助你提供個(gè)性化的參考范文,歡迎咨詢。
摘要:目前的環(huán)境實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)精度和適用范圍都有一定限制,為此提出并改進(jìn)一種新的環(huán)境預(yù)測(cè)模型,用于預(yù)測(cè)大氣環(huán)境質(zhì)量,收集6個(gè)空氣污染物指標(biāo)和5個(gè)相應(yīng)的氣象指標(biāo)并進(jìn)行檢測(cè)。研究發(fā)現(xiàn)通過逐步線性回歸優(yōu)化多元線性方程,可以準(zhǔn)確預(yù)測(cè)短期大氣環(huán)境質(zhì)量,改進(jìn)后的模型可以相對(duì)準(zhǔn)確地預(yù)測(cè)未來大氣污染物的質(zhì)量濃度。
關(guān)鍵詞:環(huán)境監(jiān)測(cè);多元線性回歸;數(shù)據(jù)分析;預(yù)測(cè)模型
0引言
近年大氣環(huán)境污染嚴(yán)重,大氣環(huán)境污染會(huì)直接導(dǎo)致人們生活環(huán)境質(zhì)量下降,影響人體健康,同時(shí)會(huì)造成巨大的經(jīng)濟(jì)損失[1-3]。目前的大氣環(huán)境監(jiān)測(cè)數(shù)據(jù)主要是通過歷史監(jiān)測(cè)數(shù)據(jù),對(duì)未來大氣環(huán)境質(zhì)量的變化趨勢(shì)進(jìn)行預(yù)判,以便更有針對(duì)性地對(duì)人們生活生產(chǎn)活動(dòng)進(jìn)行指導(dǎo)[4-5],同時(shí)為政府相關(guān)決策和管理部門在相關(guān)制度制定過程中提供科學(xué)依據(jù)[6-8]。目前對(duì)大氣環(huán)境質(zhì)量預(yù)測(cè)的方法主要包括數(shù)值預(yù)測(cè)以及統(tǒng)計(jì)預(yù)測(cè),統(tǒng)計(jì)預(yù)測(cè)以歷史數(shù)據(jù)統(tǒng)計(jì)分析為主,結(jié)合未來發(fā)展規(guī)劃。數(shù)值預(yù)測(cè),主要是指利用數(shù)學(xué)模型進(jìn)行計(jì)算或仿真。根據(jù)經(jīng)典的劃分方法,數(shù)學(xué)方法可以分為以下3類:第一類是“梯度輸運(yùn)理論”,它假定湍流通量與平均梯度成正比;第二種是以泰勒統(tǒng)計(jì)理論為基礎(chǔ)的“湍流統(tǒng)計(jì)理論”;第三種是以量綱分析為基礎(chǔ)的“相似理論”。然而數(shù)值預(yù)測(cè)的模型精度低于統(tǒng)計(jì)預(yù)測(cè)[4],且適用范圍有一定的限制[9-10]。因此,本文采用數(shù)據(jù)易獲取且預(yù)測(cè)精度高的統(tǒng)計(jì)預(yù)測(cè)-多元線性回歸方程進(jìn)行大氣環(huán)境預(yù)測(cè)分析。
1研究基礎(chǔ)
1.1多元回歸模型
當(dāng)2個(gè)或以上自變量和因變量存在線性關(guān)系時(shí),即為多元線性回歸。其數(shù)學(xué)模型[11-12]如式(1):y=a1+a2x1+a3x2+…+am+1xm+ε(1)其中,a1,a2,a3,…,am+1為回歸系數(shù),ε為隨機(jī)誤差。回歸系數(shù)估計(jì)值采用式(2),minQ=∑nt=1[y1-(a1+a2x1t+a3x2t+…+am+1xmt)]2(2)待多元線性回歸方程求出之后,需要對(duì)其進(jìn)行檢驗(yàn)以確定其精確度。常用的檢驗(yàn)方法包括相關(guān)系數(shù)檢驗(yàn)、F檢驗(yàn)和t檢驗(yàn)[13]。(1)相關(guān)系數(shù)檢驗(yàn)相關(guān)系數(shù)是用來衡量線性模型擬合程度的指標(biāo),數(shù)學(xué)表達(dá)式是回歸平方和占總平方和的比值,如式(3):R2=SSR/pSST/n-p-1(3)(2)F檢驗(yàn)F檢驗(yàn)用來檢驗(yàn)線性模型中自變量和因變量之間的關(guān)系是否顯著,如式(4):(3)t檢驗(yàn)通過t檢驗(yàn)可以決定作為某一變量是否作為自變量保留在模型中,如式(5):式(3)~式(5)中,SST表示因變量觀測(cè)值和均值的差異的偏差平方和,SSR是由自變量引起的偏差,即回歸平方和,SSE是實(shí)驗(yàn)誤差等引起的剩余平方和,其關(guān)系如式(6):
2數(shù)據(jù)采集與處理
2.1數(shù)據(jù)采集
根據(jù)GB3095—2012標(biāo)準(zhǔn)對(duì)大氣環(huán)境質(zhì)量進(jìn)行評(píng)價(jià)。對(duì)PM2.5、PM10、CO、SO2、O3以及NO2共6項(xiàng)污染物指標(biāo)進(jìn)行監(jiān)控。例如在監(jiān)測(cè)現(xiàn)場(chǎng),共有23000個(gè)PM10質(zhì)量濃度數(shù)據(jù),其中20000個(gè)用作訓(xùn)練數(shù)據(jù),3000個(gè)用作測(cè)試數(shù)據(jù)。此外,溫度、濕度、風(fēng)速、風(fēng)向、氣壓等氣象條件會(huì)通過影響污染物在大氣環(huán)境中的擴(kuò)散而影響大氣環(huán)境質(zhì)量,如高濕度會(huì)加劇空氣污染程度。因此,本文收集6個(gè)空氣污染物指標(biāo)和5個(gè)相應(yīng)的氣象指標(biāo)。
2.2數(shù)據(jù)處理
根據(jù)每個(gè)大氣數(shù)據(jù)合理分布范圍和相互關(guān)系,檢查數(shù)據(jù)是否存在異常或互相矛盾的數(shù)值,將異常數(shù)據(jù)進(jìn)行剔除。另外采集到的數(shù)據(jù)可能存在無效或缺失的情況,采用變量平均值進(jìn)行估算補(bǔ)充。為減小大氣監(jiān)測(cè)數(shù)據(jù)之間量級(jí)、量綱的差異而導(dǎo)致的預(yù)測(cè)模型精確度下降的情形,對(duì)數(shù)據(jù)進(jìn)行歸一化處理。歸一化至[0,1]區(qū)間,設(shè)xmax和xmin分別代表原始數(shù)據(jù)最大和最小值,xi為實(shí)際數(shù)據(jù),xi表示歸一化之后的數(shù)值,歸一化計(jì)算式為之后采用計(jì)算式xi=(xmax-xmin)xt+xmin換算出輸出值。
3預(yù)測(cè)模型
3.1傳統(tǒng)多元線性回歸預(yù)測(cè)模型
將預(yù)處理過的數(shù)據(jù)構(gòu)造出多元線性回歸模型,并進(jìn)行相關(guān)系數(shù)檢驗(yàn)、F檢驗(yàn)和t檢驗(yàn)。之后將預(yù)測(cè)結(jié)果和測(cè)試數(shù)據(jù)進(jìn)行對(duì)比。因變量是PM10,自變量是溫度、氣壓等5項(xiàng)氣象數(shù)據(jù),建模方法是全部輸入。(1)相關(guān)系數(shù)檢驗(yàn)結(jié)果如表1所示,R2代表擬合效果,其值越大,說明擬合效果就越好。(2)F檢驗(yàn)結(jié)果如表2所示。從表2可以看出,F檢驗(yàn)結(jié)果小于0.01。因此5項(xiàng)氣象指標(biāo)對(duì)PM10質(zhì)量濃度具有顯著的影響。(3)t檢驗(yàn)結(jié)果如表3所示。非標(biāo)準(zhǔn)化系數(shù)用于列出回歸方程。標(biāo)準(zhǔn)化系數(shù)用來表示自變量對(duì)因變量的影響程度;偏回歸系數(shù)用來判斷某一自變量對(duì)因變量的影響是否有統(tǒng)計(jì)意義,當(dāng)其小于0.05時(shí),具有顯著的統(tǒng)計(jì)意義;當(dāng)小于0.01時(shí),統(tǒng)計(jì)學(xué)意義非常顯著。(4)預(yù)測(cè)模型線性回歸方程為:y=-3.796×1-1.296×2+2.223×3-55.059×4-0.207×5+398.212真實(shí)值和預(yù)測(cè)數(shù)據(jù)對(duì)比如圖1所示。
3.2改進(jìn)的多元線性回歸預(yù)測(cè)模型
考慮到污染物質(zhì)之間存在物理化學(xué)反應(yīng),同時(shí)季節(jié)因素對(duì)污染物也有重要的影響。因此,將其他污染物和季節(jié)因素一并納入多元方程進(jìn)行優(yōu)化。季節(jié)變量取值為:春季108.1μg/m3,權(quán)重0.25;夏季97.8μg/m3,權(quán)重0.2;秋季112.3μg/m3,權(quán)重0.25;冬季121.9μg/m3,權(quán)重0.3。通過將自變量逐個(gè)引入回歸模型,進(jìn)行顯著性檢驗(yàn),直至所有顯著自變量均被引入回歸模型。逐步回歸模型結(jié)果如表4所示。從表4可以看出,PM2.5對(duì)PM10的影響最大,而大氣污染物SO2、NO2、CO以及氣象因素風(fēng)向?qū)Γ校停保暗挠绊懣珊雎裕虼藢⑦@幾項(xiàng)指標(biāo)刪除后,得表5。得回歸方程:y=30.304×1+19.729×2-0.359×3+8.541×4+0.897×5+5.184×6+10.280×7-90.087采用該模型,所得真實(shí)值與預(yù)測(cè)值如圖2所示。從圖2可以看出,優(yōu)化后的模型,擬合度達(dá)到0.828,比原始模型明顯提高,說明采用逐步線性回歸方式,將氣象因素以及其他污染物質(zhì)一并考慮之后,對(duì)PM10的預(yù)測(cè)將更加準(zhǔn)確。此外,從圖2也可以看出,短期的預(yù)測(cè)誤差最小。同時(shí),PM2.5、風(fēng)速、氣壓、濕度和季節(jié)對(duì)PM10質(zhì)量濃度有增強(qiáng)作用。PM2.5對(duì)PM10的影響最大,O3和溫度對(duì)PM10的影響有所減弱。2種預(yù)測(cè)模型效果對(duì)比如表6所示。
4總結(jié)
本文分別采用原始多元線性回歸模型以及優(yōu)化后的模型,分別對(duì)大氣環(huán)境質(zhì)量進(jìn)行預(yù)測(cè),得出如下結(jié)論。(1)傳統(tǒng)多元線性回歸模型只能相對(duì)粗略地預(yù)測(cè)大氣環(huán)境質(zhì)量變化趨勢(shì),而其改進(jìn)模型能夠相對(duì)準(zhǔn)確地對(duì)未來大氣污染物質(zhì)量濃度進(jìn)行預(yù)測(cè)。(2)采用逐步線性回歸方式將氣象因素以及其他污染物質(zhì)一并考慮能夠更加準(zhǔn)確地對(duì)PM10進(jìn)行預(yù)測(cè),且對(duì)短期內(nèi)的預(yù)測(cè)誤差最小。
作者:翟維 單位:西安航空學(xué)院
多元統(tǒng)計(jì) 多元文化論文 多元化教學(xué) 多元智能教學(xué) 多元統(tǒng)計(jì)學(xué) 多元化經(jīng)營(yíng)風(fēng)險(xiǎn) 紀(jì)律教育問題 新時(shí)代教育價(jià)值觀