基于高光譜分選設(shè)備的關(guān)鍵技術(shù)——分類算法
發(fā)布時(shí)間:2023-10-10
瀏覽次數(shù):598
分類算法是高光譜分選設(shè)備的關(guān)鍵技術(shù)之一。高光譜數(shù)據(jù)的分類算法可以分為基于光譜相似度匹配的分類方法和基于機(jī)器學(xué)習(xí)的分類方法2類。本文根據(jù)現(xiàn)有技術(shù)和研究資料,進(jìn)行了簡(jiǎn)單總結(jié)。
分類算法是高光譜分選設(shè)備的關(guān)鍵技術(shù)之一。高光譜數(shù)據(jù)的分類算法可以分為基于光譜相似度匹配的分類方法和基于機(jī)器學(xué)習(xí)的分類方法2類。本文根據(jù)現(xiàn)有技術(shù)和研究資料,進(jìn)行了簡(jiǎn)單總結(jié)。
?
高光譜相機(jī)原理
高光譜相機(jī)采集物體的反射光譜,典型的高光譜相機(jī)的原理是,光源投射到待測(cè)物體上,反射后經(jīng)過(guò)相機(jī)鏡頭前端的狹縫進(jìn)人高光譜相機(jī)內(nèi)部的核心元件一—分光儀。分光儀將每一束光分成多束單色光,投到面陣相機(jī)上。面陣相機(jī)狹縫的長(zhǎng)度方向w為像素維度,與狹縫垂直方向h為光譜維度,面陣相機(jī)w和h2個(gè)方向的分辨率決定著高光譜數(shù)據(jù)的像素分辨率和光譜分辨率。該高光譜相機(jī)的使用和線陣相機(jī)類似,一行一行的掃描,每一行的數(shù)據(jù)都是面陣相機(jī)的數(shù)據(jù),代表的是w方向上每個(gè)像素點(diǎn)上的h個(gè)光譜數(shù)據(jù),根據(jù)光譜信息進(jìn)行光譜分析可以確定其化學(xué)組成,以此來(lái)鑒別物體的材質(zhì)。
?
高光譜相機(jī)數(shù)據(jù)獲取
根據(jù)高光譜相機(jī)原理可知,高光譜相機(jī)每一幀數(shù)據(jù)都是面陣相機(jī)的二維數(shù)據(jù),而高光譜數(shù)據(jù)是三維的數(shù)據(jù),需要對(duì)相機(jī)采集到的數(shù)據(jù)進(jìn)行相應(yīng)的處理后才能獲得。高光譜相機(jī)數(shù)據(jù)獲取分為面陣相機(jī)數(shù)據(jù)獲取和數(shù)據(jù)拼接2個(gè)部分。面陣相機(jī)數(shù)據(jù)的獲取與普通2D相機(jī)數(shù)據(jù)的獲取過(guò)程并無(wú)差異,即先調(diào)整圖像質(zhì)量,然后獲取圖像。調(diào)整圖像質(zhì)量時(shí),需要調(diào)節(jié)光源的亮度、相機(jī)光圈、焦距大小以及曝光時(shí)間等,以獲得最優(yōu)的圖像效果。獲取圖像一般是連續(xù)獲取數(shù)據(jù),可以按時(shí)間間隔觸發(fā),也可以由外部I0信號(hào)觸發(fā)。如果這個(gè)10信號(hào)是編碼器,就可以實(shí)現(xiàn)按照距離觸發(fā)。觸發(fā)間隔有嚴(yán)格的要求,以保證拼接后的圖像與實(shí)際物體比例一致。
面陣相機(jī)數(shù)據(jù)的獲取完成后,還需要對(duì)數(shù)據(jù)進(jìn)行拼接,從而得到高光譜數(shù)據(jù)。高光譜數(shù)據(jù)的格式有3種,分別為BSQ,BIL和BIP。BSQ(Band Sequential Format)格式是按波段保存,1個(gè)波段保存后接著保存第2個(gè)波段。這種格式適合對(duì)單個(gè)光譜波段中任何部分的空間(X,Y)存取。BIL(Band interleaved by line format)格式是按行保存,保存第1個(gè)波段的第1行后,接著保存第2個(gè)波段的第1行,這種格式提供了空間和光譜處理之間的一種折衷方式。BIP(Band interleaved by pixel format)格式是按像元保存,先保存第1個(gè)波段的第1個(gè)像元,然后保存第2波段的第1個(gè)像元。該格式為圖像數(shù)據(jù)光譜(Z)的存取提供了最佳性能。高光譜數(shù)據(jù)拼接完成后,通常還需要1個(gè)描述文件,然后可以導(dǎo)入光譜分析軟件進(jìn)行數(shù)據(jù)處理了。
?
基于光譜相似度匹配的分類方法
光譜相似度的匹配算法是通過(guò)計(jì)算測(cè)試光譜向量與參考光譜向量之間的相似度來(lái)進(jìn)行分類。光譜相似度的度量標(biāo)準(zhǔn)包括最小距離、光譜角度、光譜信息散度以及光譜相關(guān)性等,其中最小距離度量標(biāo)準(zhǔn)包括曼式距離和歐式距離等。光譜最小距離越小,相似性越大。光譜角度余弦值越大,相似性越大。光譜信息散度值越接近于0,相似性越大。光譜相關(guān)系數(shù)越大,相似性越大。
光譜相似度的匹配算法首先要建立待測(cè)物體的光譜庫(kù),然后計(jì)算測(cè)試光譜與光譜庫(kù)中光譜數(shù)據(jù)的相似度,最后根據(jù)相似度數(shù)值以及相似度閥值來(lái)判斷物體的類別。光譜相似度匹配算法的重點(diǎn)在于待測(cè)物體光譜庫(kù)的建立,光譜庫(kù)可以是來(lái)自標(biāo)準(zhǔn)的光譜庫(kù),也可以是根據(jù)待測(cè)物體建立的自定義光譜庫(kù)。標(biāo)準(zhǔn)的光譜庫(kù)對(duì)相機(jī)和光源的一致性要求較高,實(shí)際上不同的相機(jī)、不同的光源、不同的校準(zhǔn)條件,得到的光譜曲線并不完全一致,所以標(biāo)準(zhǔn)光譜庫(kù)中的數(shù)據(jù)一般只作為參考,工業(yè)應(yīng)用上需要自定義光譜庫(kù)。自定義光譜庫(kù)時(shí),首先采集待測(cè)物體的光譜數(shù)據(jù),選取感興趣區(qū)域(ROI),并對(duì)ROI中的數(shù)據(jù)進(jìn)行端元提取,得到純凈像元,并將該像元的光譜數(shù)據(jù)存入光譜庫(kù)。常用的端元提取方法包括內(nèi)部最大體積法(N-FINDER)、純像素索引法(PPl)、凸錐分析(CCA)、頂點(diǎn)成分分析法(VCA)等。
?
基于機(jī)器學(xué)習(xí)的分類方法
基于機(jī)器學(xué)習(xí)的分類方法分為非監(jiān)督分類和監(jiān)督分類。非監(jiān)督分類是指在沒(méi)有任何分類先驗(yàn)知識(shí)的情況下,僅依據(jù)數(shù)據(jù)本身的統(tǒng)計(jì)特征及自然點(diǎn)群的分布情況來(lái)劃分類別的分類方法,代表性的非監(jiān)督分類包括均值聚類算法(K-Means)、選代自組織數(shù)據(jù)分析算法(Iterative Self?Organizing Data Analysis Technique)"。監(jiān)督分類是指以先前提取的訓(xùn)練樣本作為先驗(yàn)知識(shí),以對(duì)訓(xùn)練樣本的學(xué)習(xí)構(gòu)建分類模型,并對(duì)其他數(shù)據(jù)進(jìn)行分類的過(guò)程"。監(jiān)督分類算法常用的包括高斯最大似然分類法、最小距離分類、K近鄰、決策樹(shù)以及支持向量機(jī)等。
由于高光譜數(shù)據(jù)的波段數(shù)通常有200多個(gè)以上,包含豐富的信息,但有很多數(shù)據(jù)冗余,在進(jìn)行監(jiān)督分類之前,需要對(duì)數(shù)據(jù)進(jìn)行特征提取,選取包含信息量大的波段或者特征來(lái)降低數(shù)據(jù)的冗余程度。將原始高維數(shù)據(jù)投影到一個(gè)新的低維空間,從而獲得原始數(shù)據(jù)的更精簡(jiǎn)的表示,即降維,可以有效減少運(yùn)算量,提高運(yùn)算速度。常用的降維方法包括主成分分析(PCA)、線性判別分析(LDA)、回歸系數(shù)法、連續(xù)投影法等。以PV、PS、PP、PE和PC等塑料材質(zhì)的分選為例,對(duì)比效果如圖1所示。
分類算法加速
由于高光譜數(shù)據(jù)包含3個(gè)維度的信息,是個(gè)數(shù)據(jù)立方體,數(shù)據(jù)量很大,因此需要對(duì)算法進(jìn)行優(yōu)化加速,這樣才能滿足工業(yè)上實(shí)時(shí)分選的需求。分類算法是基于每個(gè)像素的光譜數(shù)據(jù)進(jìn)行運(yùn)算的,算法加速主要是通過(guò)并行運(yùn)算進(jìn)行加速。
NVIDIAGPU Computing Toolkit提供了豐富的教程,可以根據(jù)CUDA提供的矩陣運(yùn)算應(yīng)用開(kāi)發(fā)庫(kù)CUBLAS_Library進(jìn)行并行運(yùn)算加速,也可以參考CUDACProgramming Guide,編寫并行執(zhí)行的核函數(shù),直接操作GPU進(jìn)行并行計(jì)算加速。相比于CPU的串行運(yùn)算,GPU的并行運(yùn)算能夠提高5~10倍的運(yùn)算速度。
并行加速的另一種平臺(tái)是FPGA,F(xiàn)PGA器件屬于專用集成電路中的一種半定制電路——可編程的邏輯列陣?;诠庾V相似性匹配算法,可以通過(guò)硬件描述語(yǔ)言(HDL)寫入FPGA,實(shí)現(xiàn)硬件上的并行,其運(yùn)算的速度更快。FPGA的開(kāi)發(fā)難度較大,并行占用的FPGA資源較多,需要大容量的FPGA。
?
相關(guān)產(chǎn)品
-
什么是高光譜,高光譜前景,高光譜科研實(shí)驗(yàn)室應(yīng)用
高光譜技術(shù),又稱高光譜成像技術(shù)(Hyperspectral Imaging, HSI),是一種結(jié)合了傳統(tǒng)計(jì)算機(jī)視覺(jué)與光譜分析技術(shù)的創(chuàng)新方法。它能夠在特定光譜范圍..
-
光譜儀的應(yīng)用
光譜儀作為一種強(qiáng)大的分析工具,通過(guò)捕捉和分析物質(zhì)與光相互作用產(chǎn)生的光譜信息,為科學(xué)研究、工業(yè)生產(chǎn)、環(huán)境監(jiān)測(cè)和天文學(xué)等多個(gè)領(lǐng)域提供了重要的技術(shù)支持。本文將詳細(xì)介紹..
-
與光譜相關(guān)的化學(xué)分析儀器及其原理、優(yōu)缺點(diǎn)
?光譜儀作為化學(xué)分析中的得力助手,通過(guò)捕捉物質(zhì)與光相互作用的微妙信號(hào),揭示了物質(zhì)的內(nèi)在化學(xué)信息。本文將詳細(xì)介紹五種常見(jiàn)的光譜分析儀器——分光光度計(jì)、原子吸收光譜..
-
光譜儀的發(fā)展歷程
光譜儀,這一基于光譜學(xué)原理的精密儀器,自其誕生以來(lái),便成為了連接光與物質(zhì)世界的橋梁。它能夠?qū)⒐饩€分解成各個(gè)波長(zhǎng)的光,并通過(guò)探測(cè)器檢測(cè)記錄下來(lái),為我們揭示光源或物..