鈦鐵礦多組分高光譜品位評估
圖1b(藍色線條)為HSI捕獲到的原始平均光譜曲線,可以明顯看到在整個光譜區(qū)域沒有特異的波峰波谷。為了找出峰谷突出的區(qū)域,分析了光譜波段之間的相關(guān)性。對于維度為(x, y, λ)的高光譜數(shù)據(jù),轉(zhuǎn)換為(z = x × y, λ),并對z進行相關(guān)性分析,結(jié)果如a所示。圖中顯示紅色域的波段在整個波段中占比94.34%,其余顏色域總共占比5.66%。為了***限度地保留 “純凈數(shù)據(jù)",防止其它顏色域數(shù)據(jù)的干擾,通過查詢顏色欄數(shù)據(jù)并結(jié)合波段得知紅色與其余顏色域的相關(guān)性分界點為0.8(波段:483)。隨后,將相關(guān)性小于0.8的30個波段從數(shù)據(jù)分析中剔除,從而***了1685.47-1735.34 nm的光譜區(qū)域。得到的光譜曲線如圖1b(紅線)所示。該過程獲得的光譜數(shù)據(jù)(150×483)用于后續(xù)的模型建立和分析
采集礦石樣本高光譜圖像結(jié)合光譜曲線分析
結(jié)論
通過高光譜相機檢測出了鈦鐵礦中品位較高的9種金屬元素,根據(jù)其品位高低對樣本進行分組。其中,1%及以上為主要品位(Ti, Fe),0.02-1%為次要品位(V, Mn, Co, Cu),0.02%及以下為微量品位(Zn, Zr, Pb)。鈦鐵礦中各組分品位的統(tǒng)計分布如表1所示,可以清晰看出,不同組分的品位有明顯的差異,這對回歸模型的建立至關(guān)重要。
表1 鈦鐵礦樣品品位測定的統(tǒng)計分析
鐵礦樣本的光譜反射率值在0.03 - 0.27之間,證實粉狀鈦鐵礦的整體反射率較低,并隨品位的增加而降低。圖1b顯示在NIR區(qū)域,該鈦鐵礦的光譜特征分別在940nm、1020nm和1300~1650nm處出現(xiàn)了波谷。具體地,光譜反射率值在940 nm處達到谷值,隨后急劇下降,這主要歸因于O-Ti-O的拉伸和變形。該鈦鐵礦較寬的吸收波段主要位于1300 ~ 1650 nm,Izawa指出這是由八面體配位的亞鐵在此附近產(chǎn)生晶體場躍遷分裂而引起的。
采用SG、MSC、CR、SD、MSC+SG等5種預(yù)處理方法對原始光譜數(shù)據(jù)進行處理?;贒D模型對比原始光譜數(shù)據(jù),探索出HSI光譜數(shù)據(jù)的***預(yù)處理方法,結(jié)果如表2所示。預(yù)測集中,與原始數(shù)據(jù)相比,MSC+SG方法下的各指標R2P提高了5.88%,RMSEP降低了34.39%,RPD和RPIQ分別提高了28.86%和38.93%。
表2 DD模型下不同預(yù)處理方法的結(jié)果
為直觀地看到各預(yù)處理方法對數(shù)據(jù)的改變,繪制了HSI采集的鈦鐵礦樣本三維原始光譜如圖2a所示,圖2b-d所示三維光譜為CR、SD、MSC+SG預(yù)處理的結(jié)果。SG預(yù)處理后的光譜反射率曲線趨勢與鈦鐵礦原始光譜反射率曲線相似。MSC和MSC+SG預(yù)處理的光譜變化不大,但有效地***了光譜散射,突出了光譜峰谷區(qū)域。相比之下,CR和SD預(yù)處理后的光譜變化明顯,兩種方法的光譜反射率范圍差異過大,導(dǎo)致原始數(shù)據(jù)的一些特征丟失。然而,***MSC+SG預(yù)處理圖譜顯示,光譜特征區(qū)域顯著增強,反射率數(shù)據(jù)得以明顯集中,有效增強了光譜特征信息。因此,MSC+SG可以作為一種有效的光譜預(yù)處理方法來預(yù)測鈦鐵礦多組分的品位信息。
圖2 HSI采集鈦鐵礦樣品的三維光譜:(a) RAW光譜;(b) CR預(yù)處理后的光譜;(c) SD預(yù)處理后的光譜;(d) MSC + SG預(yù)處理后的光譜。
采用t-SNE、iPLS-VCPA-IRIV和iPLS-VIP-IRIV三種不同的降維算法對近紅外光譜數(shù)據(jù)進行不同程度地約簡。
圖3為不同降維算法的數(shù)據(jù)分布情況。t-SNE改變了原始數(shù)據(jù)集,經(jīng)該方法輸出的高維(483維)原始光譜數(shù)據(jù)特征映射到了三維平面之上。
特征選擇方法iPLS-VCPA-IRIV和iPLS-VIP-IRIV三步混合策略算法提取的波長數(shù)分別為28和38,比原始維度相應(yīng)減少了94.19 %和92.12 %。
總的來說,三種降維算法有效地***了原始光譜矩陣中的冗余信息,為減少計算時間和確保精度奠定了基礎(chǔ)
圖3 不同降維方法下的數(shù)據(jù)分布:(a) t-SNE;(b) iPLS-VCPA-IRIV;(c) iPLS-VIP-IRIV。
表3為鈦鐵礦樣本中各組分的VIF檢驗分數(shù)。在相關(guān)程度上,L代表相關(guān)度低,H代表相關(guān)度高。對于每個變量,VIF得分均不超過2,
說明各變量之間的共線性現(xiàn)象不突出,相關(guān)程度符合研究要求。因此,可以采用數(shù)據(jù)預(yù)處理,降維等方法對各組分品位數(shù)據(jù)進行處理,并參與模型預(yù)測。
表3 鈦鐵礦樣品中各組分的VIF指數(shù)。
提取礦石樣本的顏色特征是否可以用于構(gòu)建品位預(yù)測模型,還有待進一步驗證?;阝佽F礦多組分品位(平均品位)與顏色特征參數(shù)進行Pearson相關(guān)性分析(圖4)。從圖中可以看出,除S顏色通道的特征參數(shù)與多組分品位存在弱相關(guān)(R < 0.3)外,其余顏色特征參數(shù)對于品位預(yù)測模型都是合理的。造成這種現(xiàn)象的原因是,鈦鐵礦本身是一種不透明礦物,而HSI采集到的圖像過于單一,整體顏色偏暗。
圖4 品位和顏色特征參數(shù)的皮爾遜相關(guān)性分析
多元回歸模型DD、PLSR和SSA-KELM可能對兩個維度中某一特定數(shù)據(jù)集的表現(xiàn)好,但基于多組分品位模型穩(wěn)定性的需求,BPNN才是*佳的模型選擇。
圖5為基于BPNN兩個效果*好的光譜和圖像數(shù)據(jù)結(jié)果,可以看出,兩個數(shù)據(jù)的指標變化差異不大,證實了BPNN模型即使在小樣本量下也具有很強的泛化性能和魯棒性。
綜合評價表明,BPNN對兩組數(shù)據(jù)集的預(yù)測都是成功的,但利用圖像數(shù)據(jù)預(yù)測鈦鐵礦多組分品位的可靠性略低于利用特征選擇的光譜數(shù)據(jù)。
從iPLS-VCPA-IRIV特征選擇的擬合光譜數(shù)據(jù)圖(圖6)可以看出,在校正集中,鈦鐵礦多組分品位都均勻準確地分布在理想曲線上。然而,對于預(yù)測集來說,明顯可以看出來的是,除擬合良好的主要品位(Ti、Fe)和次要品位(V、Mn、Co、Cu)外,微量品位(Zn、Zr、Pb)的擬合似乎并不令人滿意。因此,在下一步工作中,可以對少樣本量下礦石內(nèi)部微量品位的變化進行更深入的研究。
本解決方案從光譜和空間維度出發(fā),探討了HSI與化學(xué)計量學(xué)相結(jié)合預(yù)測鈦鐵礦多組分品位的能力。
電話
微信