
油菜是我國重要的食用油來源,居5大油料作物之首。我國是世界油菜主產(chǎn)國,油菜面積、產(chǎn)量均居世界第一。然而,油菜在生長過程中雜草危害比較嚴(yán)重。傳統(tǒng)的化學(xué)除草一方面污染農(nóng)業(yè)生態(tài)環(huán)境,而且除草劑使用效率比較低,因此正確識(shí)別雜草的關(guān)鍵便是實(shí)現(xiàn)除草劑的精確噴灑。
高光譜成像技術(shù)是一種融合了圖像處理及光譜分析的新型技術(shù),其中圖像數(shù)據(jù)對農(nóng)作物的表面損傷及外部特征可進(jìn)行真實(shí)展現(xiàn),而光譜數(shù)據(jù)則反映了作物內(nèi)部的結(jié)構(gòu)及成分。因此,近幾年高光譜成像技術(shù)被越來越多地應(yīng)用于雜草分類識(shí)別、農(nóng)產(chǎn)品品質(zhì)無損檢測方面。
本工作采用多種預(yù)處理方和特征波長提取方法對油菜和雜草冠層的高光譜圖像數(shù)據(jù)進(jìn)行處理,分別建立了基于全譜和特征波長的分類模型。通過分析比較不同分類模型的結(jié)果,可以得到不同光譜采集時(shí)間、不同油菜品種對雜草分類識(shí)別的影響。
1實(shí)驗(yàn)部分
1.1樣本
實(shí)驗(yàn)所用的油菜樣本和四種雜草,分別為稗子、和萌、苘麻和三葉鬼針草,均為油菜田內(nèi)常見的影響較大的雜草品種,且與油菜的生長周期類似。圖1為試驗(yàn)中所使用樣本的圖像。

1.2光譜圖像采集
應(yīng)用了400-1000nm的高光譜相機(jī),可采用杭州彩譜科技有限公司產(chǎn)品FS13進(jìn)行相關(guān)研究。光譜范圍在400-1000nm,波長分辨率優(yōu)于2.5nm,可達(dá)1200個(gè)光譜通道。采集速度全譜段可達(dá)128FPS,波段選擇后最高3300Hz(支持多區(qū)域波段選擇)。
油菜和雜草的高光譜信息采集共分為3次,依次定義為1,2和3。另外每次數(shù)據(jù)采集過程中,由于油菜和雜草都在生長,因此都需要對相機(jī)曝光時(shí)間、采集高度等內(nèi)部參數(shù)進(jìn)行調(diào)節(jié)從而獲取相對失真最小的高光譜圖像。表1為3次試驗(yàn)時(shí)的高光譜成像儀的內(nèi)部參數(shù)。
1.3數(shù)據(jù)特征提取
對所研究的油菜和雜草的高光譜圖像,提取每株植株的感興趣區(qū)域以整個(gè)去除背景之后的樣本區(qū)域?yàn)?/span>ROI,對ROI內(nèi)計(jì)算并統(tǒng)計(jì)各波段的平均光譜,實(shí)現(xiàn)圖譜變換用于最終的數(shù)據(jù)處理。提取ROI的原則之一是盡可能地去除非植株冠層的區(qū)域,使得冠層區(qū)域圖像與背景圖像進(jìn)行高程度的分割。分割冠層的方法如下:
(1)分析比較ROI區(qū)域和非ROI區(qū)域的像素點(diǎn)對應(yīng)的光譜信息,尋找能夠區(qū)分這些點(diǎn)的波段,最終選取800 nm波段圖像作為掩膜,并設(shè)置閾值進(jìn)行二值化構(gòu)建掩膜;
(2)掩膜圖像中,背景區(qū)域變?yōu)?/span>0,而樣本信息區(qū)域變?yōu)?/span>1,對原始高光譜圖像進(jìn)行掩膜,從而實(shí)現(xiàn)將背景區(qū)域去除的效果。圖2為基于高光譜662,554和450 nm三個(gè)波段下RGB偽彩圖的ROI獲取過程。

1.4數(shù)據(jù)處理方法
1.4.1預(yù)處理方法
采用正態(tài)變量變換、去趨勢化、多元散射校正、移動(dòng)平均平滑法、多項(xiàng)式卷積平滑法、基線校正及歸一化對樣本的高光譜數(shù)據(jù)進(jìn)行預(yù)處理。
1.4.2特征波長提取方法
采用主成分載荷、載荷系數(shù)法、回歸系數(shù)法、連續(xù)投影算法分別進(jìn)行特征波長提取。主成分載荷挑選特征波長,主要是基于在不同的主成分下載荷值表明了波長的不同重要程度,因此選擇主成分載荷圖中的峰谷值為特征波長;載荷系數(shù)法(x-LW)根據(jù)x-LW曲線挑選特征波長,其中絕對值較大且為波峰的波長即為特征波長;RC曲線中的波峰、波谷和拐點(diǎn)即為通過回歸系數(shù)法)選擇的特征波長12]。SPA對數(shù)據(jù)組包含的向量多次連續(xù)的投影進(jìn)行分析,降低數(shù)據(jù)含量的冗余度,提升計(jì)算的效率和速度。
2結(jié)果與討論
2.1油菜和雜草的平均光譜曲線
采集了380~1034 nm波長范圍的512個(gè)波段的近紅外光譜數(shù)據(jù),由于噪聲明顯影響光譜的前端和后端,因此去除掉前后端兩部分的噪聲波段,采用453~934 nm之間380個(gè)波段的光譜進(jìn)行分析,建立油菜和雜草的平均反射光譜曲線如圖3所示。從圖可知,油菜和四種雜草趨勢相似,雜草曲線較為分散,鬼針草和油菜有重合,但在550 nm波峰處反射率有明顯區(qū)分。

將樣本按照3:1的比例分成建模集和預(yù)測集,其中建模集72個(gè)油菜和48個(gè)雜草樣本,預(yù)測集24個(gè)油菜和16個(gè)雜草樣本。其中需要注意的是,四種雜草在建模集中每種12個(gè)樣本,預(yù)測集中每種四個(gè)樣本。
2.2主成分分析定性分析
對油菜和雜草光譜數(shù)據(jù)進(jìn)行主成分分析可知,三次試驗(yàn)PC1和PC2累計(jì)貢獻(xiàn)率為99%,PC1和PC2能夠解釋絕大部分的變量[4],三次試驗(yàn)主成分得分分布圖如圖4所示。由圖可知,得分圖中油菜和雜草分別聚集在一起,進(jìn)一步表明油菜和雜草可進(jìn)行有效的鑒別,接下來繼續(xù)利用光譜數(shù)據(jù)進(jìn)行分析和處理。


2.3基于全波段的分類識(shí)別結(jié)果
對光譜進(jìn)行De-trending預(yù)處理,基于三種算法進(jìn)行全譜建模,識(shí)別精度如表3所示。由表3可知,PLS算法第二次試驗(yàn)分類效果未達(dá)到90.00%,SVM和ELM算法效果比較好,尤其是ELM算法分類精度最優(yōu),3次試驗(yàn)均達(dá)到了100.00%。

2.4特征波長的分類識(shí)別結(jié)果
基于De-trending預(yù)處理,將上述四種方法提取出的特征波長所對應(yīng)的反射率作為輸入變量,由于基于全譜的ELM模型判別效果在不同批次實(shí)驗(yàn)之間效果較優(yōu),因此基于特征波長建立ELM判別分析模型。其分類結(jié)果如表4所示。
從表4可知,四種提取方法均得到了比較好的分類效果,采用PCA loadings,x-loading weights及SPA提取的特征波長建立的識(shí)別模型的分類效果非常好,建模集和預(yù)測集的分類效果均達(dá)到了100.00%。


