最近中文字幕2018免费版2019,久久国产劲暴∨内射新川,久久久午夜精品福利内容,日韩视频 中文字幕 视频一区

首頁 > 文章中心 > 正文

小議多元統計分析方法的運用

前言:本站為你精心整理了小議多元統計分析方法的運用范文,希望能為你的創作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。

小議多元統計分析方法的運用

1回歸分析

回歸分析(regressionanalysis)是統計學中一種常用的分析數據的方法,旨在研究一個變量Y與其他若干變量X之間的相關關系,實際應用較為廣泛。根據涉及自變量的個數,可將其分為一元回歸分析、多元回歸分析;根據自變量與因變量之間的關系類型,可將其分為線性回歸分析、非線性回歸分析。當回歸分析中僅包含一個自變量、一個因變量,且二者關系可用一條直線近似表示,該回歸分析為一元線性回歸分析。當回歸分析中包含兩個或兩個以上的自變量,且因變量與自變量之間是線性關系,則稱為多元線性回歸分析。回歸分析常用于觀測數據,目的是獲得因果結論。回歸分析的結果是最佳擬合直線的數學方程,該方程的用途之一是預測[5-6]。曾憲昌等[7]較早運用通徑分析原理對貴州省58頭不同年齡、性別的沿河山羊的體尺和體質量關系作出較為系統深入的分析。借助通徑圖解簡明地表達各變量之間的關系,并在區分各自變量在多元回歸中的相對重要性后,剔除影響不大的自變量,在偏回歸系數顯著性檢驗合格的基礎上,建立最優回歸方程,直接用體長和胸圍估計體質量和屠宰率對山羊產肉性能進行預測。陳永軍等[8]運用SPSS14.0分析成年大足黑山羊體尺與體質量的相關關系、體尺對體質量的直接和間接作用以及決定程度,最后建立體質量與體尺的最優回歸模型。結果表明:胸寬和管圍是影響公羊體質量最主要的體尺指標,胸圍是影響母羊體質量最主要的體尺指標。公羊最優回歸模型為:Y=19.630-0.940X6+4.346X7,母羊最優回歸模型為:Y=-17.942+0.661X4。(注:Y指體質量、X6指胸寬、X7指管圍、X4指胸圍)王高富等[9]采用SAS軟件CORR對重慶黑山羊成年羊體尺、體質量指標與胴體凈肉率進行相關分析,并以成年重慶黑山羊體高、體斜長、胸圍、胸寬、胸深、成年體質量為自變量,胴體凈肉率為應變量,采用REG過程BACKWARD(后退法)的多元回歸分析方法,構建估測重慶黑山羊胴體凈肉率的最優回歸方程,結果表明:胸圍、胸寬和胸深可以作為選擇胴體凈肉率的間接指標。韓學平[10]采用逐步回歸的方法對隨機抽測的青海省河南縣40只歐拉型藏羊成年公羊和104只成年母羊的體質量和8個主要體尺指標進行回歸分析,得到歐拉型藏羊成年公羊體質量和主要體尺指標的最優回歸方程為Y=0.88X2+13.64X6-4.35X7+1.28X4-114.51(P<0.01)(R=0.889);成年母羊體尺與體質量的最優回歸方程為Y=0.49X1+0.46X2+0.30X3+0.43X4-43.51(P<0.01)(R=0.649)。(注:Y指體質量、X2指體長、X6指管圍、X7指尾寬、X4指胸深、X1指體高、X3指胸圍)馮平等[11]采用相關分析、通徑分析和回歸分析的方法研究不同年齡段陜北白絨山羊體尺、體質量、絨長、毛長和產絨量的最優回歸模型。結果表明:陜北白絨山羊在4歲時處于最佳生長階段,產肉和產絨性能最好;產絨量和體尺、體質量、毛長、絨長的最優回歸模型為Y=0.559X10+0.391X4-0.176X9+0.196X7-0.169X8。(注:Y指產絨量、X10指絨長、X4指胸圍、X9指毛長、X7指管圍、X8指腰角寬)陳碧紅等[12]運用SAS軟件分析戴云山羊體尺與體質量間的相關、體尺對體質量的直接和間接影響以及體尺對體質量的決策程度,最后建立體質量與體尺的最優回歸模型。結果表明:各體尺性狀因素都在不同程度上影響戴云山羊的體質量。選育戴云山羊時應以胸部為主并兼顧體高,以取得較好的選育效果。

2主成分分析

主成分分析(principalcomponentanalysis)是由K.皮爾森對非隨機變量引入的,用于分析數據及建立數理模型,爾后H.霍特林將此法推廣應用于隨機變量中。主成分分析又稱主分量分析,是將多個變量通過線性變換以選出較少個重要變量的一種多元統計分析方法。在實際課題的研究中,為了全面系統地分析問題,常會涉及眾多與此有關的變量,每個變量在不同程度上反映該課題的部分信息。信息的大小通常用離差平方和或方差來衡量。主成分分析可設法將原來變量重新組合成一組新的互相無關的幾個綜合變量,同時根據實際需要從中取出幾個較少的綜合變量盡可能多地反映原來變量的信息,是數學上處理降維的一種方法。主成分分析是多元統計中的重要內容,是當前許多研究的主題,其原則是將多個相關指標簡化為少數不相關指標,它能夠在不損失過多遺傳信息的基礎上進行多性狀的方向性選擇,同時提高選擇效果[13]。近年來,該方法已被廣泛應用于牛、羊、豬等家畜性狀的選育工作中。姜加華[14]于2004年對波爾山羊雜交二代(F2)羔羊各階段體質量和體尺指標進行主成分分析,建立F2的生長模型,為制定新品種培育方案、飼養管理方案提供理論依據,為確定綜合選育指標奠定基礎。劉錚鑄等[15]采用主成分分析法,分析波爾山羊與唐山奶山羊的級進雜交三代羔羊不同年齡階段體高、體長、腿臀圍、胸圍和體質量等與生長相關的性狀,綜合為幾個主成分,并由此確定衡量波唐三代羔羊生長發育性狀的指標,探討評估個體羊的生長發育狀況。結果表明,在波唐三代羔羊l周齡時,體質量對主成分影響最大,隨著年齡增長,在1月齡、2月齡和4月齡對主成分影響最大的是體長和腿臀圍,在1月齡和2月齡,第二主成分主要反映羔羊的體高信息。白俊艷等[16]對成年大尾寒羊的體長、體高、體質量、胸圍、尾長、尾寬進行測量,利用SPSS軟件對以上6個體尺指標進行主成分分析。結果表明,第一主成分的貢獻率較高為59.043%,其中高載荷的指標有體高、體長,這些體尺決定大尾寒羊體形的長短高矮,將其命名為高度因子。第二主成分的貢獻率為16.919%,其中高載荷的指標有尾長、尾寬,其反映大尾寒羊尾巴形狀的變化特征,將其命名為尾形因子。第三主成分的貢獻率為11.081%,其中高載荷的指標有體質量、胸圍,這些體尺與大尾寒羊體形結構均衡性密切相關,反映大尾寒羊軀體大小程度,將其命名為軀體因子。若取前3個主成分,其特征根值可使累積貢獻率達到87.043%,即用這3個主成分可解釋6個體尺指標總體信息,且信息損失部分較小,信息損失僅占12.957%。

3因子分析

因子分析(factoranalysis)是研究從變量群中提取共性因子的統計技術。因子分析的模型最早由J.Penrson和C.S.Pearman提出,首先應用于心理學研究。由于這種研究收到較好的效果,因而引起科學界的注意。數十年來許多統計學家以及其他科學工作者在因子分析的理論、方法和實際應用等方面做大量的工作,使因子分析不斷得到充實并成為多元統計學的重要組成部分。與此同時因子分析的應用也逐漸推廣到心理學以外的其他學科,如經濟學、生物學、植物學、地質學、化學等[17-18]。因子分析與主成分分析都有清理多個原始變量內在結構關系的作用,但主成分分析重在綜合原始變量的信息,而因子分析重在解釋原始變量間的關系,是比主成分分析更深入的一種多元統計方法[19]。因子分析旨在從許多變量中找出隱藏的具有代表性的因子,并將相同本質的變量歸入公因子,通過建立公因子與原變量之間的數量關系來預報公因子的狀態,幫助發現隱藏在原變量之間的某種客觀規律性。因子分析可減少變量數目,還可檢驗變量間關系的假設。在因子分析過程中,因子數的準確確定是極其重要的。由于分析數據(通常由試驗測得)存在誤差,這就給確定因子數帶來很大困難。如何在摻和誤差的試驗數據中準確地找出影響原始分析數據的因子數,是因子分析研究中的一個特別重要也很困難的研究課題。多年來,不少致力于因子分析理論研究的工作者在這方面作了很大的努力。然而,迄今還沒有現成的準確確定一套試驗數據中有多少有意義的因子的嚴格的方法。不過,已有不少判據在確定因子數時是行之有效的,其中被應用得較多的有E.R.Malinowk等提出的判據(如RE、IND等),用交互校驗和頻串分布等方法確定因子數也是相當有效的,這一方面的研究尚有待進一步的深入[17]。葉昌輝等[20]應用主因子分析的方法對廣東省96頭雷州山羊成年母羊的8個主要體尺性狀進行研究分析,結果顯示,雷州山羊成年母羊的8個體尺性狀之間的相關系數均為正值,為正相關,可區分為相對獨立的3個主因子。其中,第一主因子的貢獻率最大,為60.00%,其中腰角寬、胸寬、胸圍和胸深的因子載荷值較高,考慮其生物學意義,稱第一主因子為軀體因子。同時,山羊軀體大小與屠宰率相關聯,故軀體因子是山羊產肉率的一個間接指標。此外,第二主因子的貢獻率為16.59%,稱為高度因子;第三主因子的貢獻率僅為7.64%,稱為肢體因子。第一主因子的方差解釋量最大,是雷州山羊變異的主要來源,故在今后的選育工作中應給予足夠重視,以主因子為單位進行選種,結合其他性狀的選擇,提高雷州山羊的選育效率。

4聚類分析

聚類分析(clusteranalysis)又稱集群分析,它是研究“物以類聚”的一種數理統計方法。聚類分析可將一些觀察對象依據某些特征加以歸類,在生物學和醫學分類問題中有著廣泛的應用[21]。聚類分析的基本思想是:所研究的樣品或指標之間存在著程度不同的相似性。于是根據一批樣品的多個觀測指標,具體找出一些能夠度量樣品或指標間相似程度的統計量,以這些統計量為劃分類型的依據,將相似程度較大的樣品聚為一類。聚類分析的目標就是在相似的基礎上收集數據并分類,關系密切的對象聚為一個小的分類單位,關系疏遠的對象聚為一個大的分類單位,最終把所有的樣品或指標聚類完畢,即可形成一個由小到大的分類系統。聚類結果體現數據的分布特征,聚類方法多種多樣,針對不同的問題應該采取不同的方法[22]。聚類分析有不同的分類[23-24]:按聚類變量可分為樣品聚類(caseclusteranalysis,又稱Q聚類),和指標聚類(variableclusteranalysis,又稱R聚類);按聚類方法可分為系統聚類(joiningclusterprocedures)和動態聚類(iteractivepartitioningprocedures);按數據的歐幾里得距離的遠近進行分類分析,常用的有譜系聚類法(hierarchicalcluster)和分類聚類法(disjointcluster)。趙宗勝等[25]對3種不同類型雜交肉用羊的體尺指標進行聚類和主成分分析,將所分析的17項體尺指標分為三大類:特征類、圍度類、高長度類。運用這兩種方法,所得結果基本一致,但對于不同的雜交組合,結果有一定的差異。根據3種雜交組合的體尺與主成分分析結果,3種羊的第一、二主測指標略有不同,表明其對于不同類型雜交系各種指標的度量應有不同的側重點。從而揭示出不同類型雜交肉羊體尺差異性的規律,為今后的肉羊品種選育、鑒定、評價提供新的思路和依據。侯洪梅[26]采用SPSS軟件對62只7月齡青海加什科公羔體尺和體質量指標進行聚類分析,分為4類,并對各類羊只的各項指標計算類內均值和標準差,根據均值差異確定4類各項指標區間,得出更具操作性和實用性的加什科羊品種鑒定結果。

5判別分析

判別分析(discriminantanalysis)是在分類確定的條件下,根據某一研究對象的各種特征值判別其類型歸屬問題的一種多變量統計分析方法。進行判別分析時通常根據已知樣本的分類及所測的指標,篩選出能提供較多信息的指標,從而建立判別方程,使其錯判率最小。其基本原理是按照一定的判別準則,建立一個或多個判別函數,用研究對象的大量資料確定判別函數中的待定系數,并計算判別指標。據此即可確定某一樣本屬于何類。判別分析的目的是建立一個判別函數式,建立判別函數式的法則主要有Fisher判別準則和Bayes判別準則。根據已知分類的數目、是否篩選變量和變量間是否有共線性,判別分析可分為二類判別、多類判別、逐步判別和典則判別分析[27-28]。敖學成等[29]經3個點抽樣測定,用體尺、體質量性狀指標對四川省美姑縣58只成年母羊的遺傳多樣性進行聚類分析和判別分析,表明美姑縣高繁山羊類群中存在大、中、小類型,具有選擇高產肉用山羊的基礎,得出從當前羊群綜合性狀結構的多樣性特點開展有計劃的選育十分必要。提出并分析母羊分類的三個判別函數式,其中體高、十字部高、體長、胸圍、胸深、胸寬、體質量等性狀類別間組內均值相等性檢驗均達到極顯著和顯著水平,可從表型值作出判定,因此可作為當前選育的參考依據。陳暖等[30]用SPSS軟件對崇明白山羊、海門山羊、徐淮山羊、關中奶山羊的17個體尺指標進行典型判別和逐步判別分析,提供一種基于體尺指標的山羊不同品種和地理類型的量化分析方法。結果表明:該方法總體判別率可達到95.5%,當要求交叉驗證正確率>90%時,至少需要9個體尺指標;在品種間兩兩進行比較時,對判別貢獻率最大的指標因品種不同而異。在該研究范圍內,角型和胸寬是崇明白山羊區別于其他山羊的兩個最具區分度的體尺指標。

6相關分析

相關分析(correlationanalysis)是研究變量之間密切程度的一種常用統計方法。兩個變量之間的變化關系,既表現在變化方向上,又表現在密切程度上。相關分析旨在研究變量之間是否存在某種依存關系,且對存在依存關系的變量探討其變化方向、密切程度。若兩個變量變化方向一致則為正相關,若兩個變量變化方向相反則為負相關。簡單相關系數(由KarlPearson提出,有時也稱作Pearson相關系數)用來度量變量間的線性相關關系的強弱程度。相關系數的符號(+或-)代表著變量間相關關系的方向(正相關或負相關)[31-32]。狄江[33]對中國美利奴羊(新疆型)體大品系育種群的2歲母羊進行體尺與主要性狀的相關及通徑分析。結果表明,體大品系羊體長、胸圍與體質量呈顯著的正相關(P<0.01);體高、體長、胸圍通過提高凈毛率而間接增加凈毛量;毛長對污毛量、凈毛量無直接影響;凈毛率與污毛量是極顯著的負相關(P<0.01)。劉金福等[34]在昌黎和盧龍兩地測定89只唐山奶山羊成年母羊的體尺和體質量,并利用國際上通用的SAS統計分析軟件對所測的各項資料進行統計分析,得出唐山奶山羊成年母羊體質量和體尺性狀間的生長發育存在著較強的內在聯系,在性狀的選擇方面可以利用這些較強的相關關系達到育種目的。賈存靈等[35]運用SAS軟件分析薩福克×(無角陶賽特×小尾寒羊)三元雜交組合3月齡公羔體尺與體質量間的表型相關、體尺對體質量的直接和間接影響,并建立最優回歸模型。薩福克×(無角陶賽特×小尾寒羊)三元雜交組合3月齡羔羊體尺各指標均與體質量有極顯著的相關關系(P<0.01),其中胸深和胸圍是影響三元雜交公羔體質量的主要因素。在選擇三元雜交公羔體質量的同時,應加強對胸深和胸圍的選擇力度。吳平等[36]采用MicrosoftExcel2007和SPSS16.0軟件進行基本處理和相關分析,用全回歸法(Enter)對體質量和體尺指標進行回歸分析。研究主要針對關中奶山羊羔羊在3月齡內的體質量與體尺的生長發育情況而進行。研究表明,從初生到4月齡,羔羊生長發育迅速,尤其表現在初生后的前2個月左右,而此時也是母羊泌乳的最高峰期。通過對體質量與體尺之間相關性的研究得知,體質量與體長、胸圍、體高之間都存在極顯著的相關。在進行飼養培育時這3個指標都很重要,可作為此階段選育的依據。

7綜合分析

綜合分析是指同時引用多種多元統計方法進行分析。較常見的是相關分析和回歸分析的綜合運用。扎西卓瑪等[37]應用相關分析的方法,對83只柴達木絨山羊(互交羊)周歲母羊的胸圍、抓絨前體質量、絨層厚度、粗毛量4個性狀與產絨量性狀的關系進行分析。結果表明這4項性狀與產絨量均具有顯著的相關性,用這4項性狀估測產絨量的回歸方程:Y^=114.7689-3.3302X1+5.6125X2+0.1935X3+1.1142X4。經F檢驗得該回歸方程具有一定的可靠性。(注:Y指產絨量、X1指胸圍、X2指抓絨前體質量、X3指絨層厚度、X4指粗毛量)王欣榮等[38]采用多元逐步回歸分析方法,對隨機抽測的甘肅省甘南州草地型藏羊225只成年公羊和290只成年母羊的體質量和主要體尺指標進行相關性分析。結果表明:甘南草地型藏羊成年公羊體質量和主要體尺指標的最優回歸方程為Y=0.118X1+0.652X3+0.196X4(R=0.901,0.01<P<0.05);成年母羊體質量和主要體尺指標的最優回歸方程為Y=0.111X1+0.186X2+0.626X3(R=0.849,P<0.01)(注:Y指體質量、X1指體高、X3指胸圍、X4指管圍、X2指體長)。回歸模型顯示,胸圍和體高是影響甘南草地型藏羊體質量的主要體尺指標,建議在今后的選育工作中加大對胸圍和體高的選擇力度,以提高藏羊的平均體質量。梁學武等運用SPSS13.0軟件[39-40],分別用Logistic、Bertalanffy和Gompertz模型對波爾山羊的體質量性狀進行非線性擬合,并對體質量與體高、體長、胸圍的相關性進行分析[41]。得出波爾山羊生長曲線采用Logistic模型擬合效果最佳,公母羊生長模型分別為:W=51.59×(1+6.15×e-1.82)-1(R2=0.9815)和W=52.56×(1+7.15×e-2.08)-1(R2=0.9834)(注:W指體質量)。公羊的生長拐點為14月齡,體質量25.80kg,成熟體質量為51.59kg;母羊的生長拐點為16月齡,體質量26.28kg,成熟體質量為52.56kg。在山羊的生長拐點前,加強飼養,可充分發揮其生長潛力,提高生產性能。波爾山羊體質量與胸圍性狀呈極顯著正相關(P<0.01),與體高性狀呈顯著正相關(P<0.05),體質量與體高及胸圍的二元回歸方程為:Y=0.279Btg+0.893Bxw-19.28(注:Y指體質量、Btg指體高、Bxw指胸圍)。生產實踐中,可利用此回歸方程估測體質量。

8小結

綜上所述,利用多元統計分析深化對羊體質量與體尺方面的研究,許多研究人員已經作出較好的研究成果。以上介紹的運用多元統計方法對羊的體質量體尺各項指標綜合分析,結果較好地反映體質量體尺性狀信息與研究對象的關系。多元統計分析方法應用于畜牧統計分析,具有較強的科學性,生物數學、統計學的發展為動物醫學的現代化研究提供新的方法和理論思考。值得一提的是,多元統計分析是研究多因素和多指標問題的統計方法,各種具體的分析方法在實際應用中各有優缺點,其中有些缺陷通過兩種或多種方法聯用可以克服,但有些缺陷卻是克服不了的,在生產實踐中需要靈活掌握。

作者:張帆顏亭玉楊佐君郭勇杜曉林單位:北京農學院動物科學技術學院基礎教學部

主站蜘蛛池模板: 恩施市| 资溪县| 江源县| 哈尔滨市| 拜城县| 电白县| 衡水市| 大冶市| 固安县| 达拉特旗| 茌平县| 阳信县| 高密市| 惠州市| 平潭县| 苍南县| 仪征市| 顺昌县| 新蔡县| 监利县| 阿荣旗| 康乐县| 遵义县| 德昌县| 白水县| 会东县| 仙居县| 吉木乃县| 遂平县| 临沧市| 古田县| 乐山市| 隆昌县| 房山区| 寻乌县| 榆中县| 绥芬河市| 三亚市| 长宁县| 喀喇| 旅游|