?高光譜成像的牛肉丸摻假檢測
肉丸是一種有著特別口感的肉類深加工產(chǎn)品,深受人們喜愛。相比于豬肉、雞肉、魚肉等其他原料肉,牛肉的蛋白質(zhì)含量較高,肌纖維較粗,因而加工特性更好,牛肉丸也比其他肉丸更有彈性和嚼勁。在我國,以廣東潮汕地區(qū)制作的牛肉丸為著名。然而,有不法商販受利益驅(qū)使,在牛肉中摻入豬肉,雞肉等廉價肉制作肉丸冒充純牛肉丸售賣。這種行為不僅擾亂市場秩序,還會引發(fā)一些宗教問題。廣東省發(fā)布地方標(biāo)準中明確規(guī)定汕頭牛肉丸中牛肉占原料肉的比例須大于90%。因而有必要研究快速檢測牛肉丸摻假的方法。目前,常用的肉類產(chǎn)品摻假鑒別方法有蛋白質(zhì)組學(xué)分析法,DNA分析法,傳感器法和光譜法等。這些檢測方法各有其優(yōu)缺點。蛋白質(zhì)組學(xué)分析法檢測結(jié)果準確,但所用設(shè)備價格昂貴,重復(fù)性較差。DNA分析法檢測限低,靈敏度高,但操作復(fù)雜,且同樣存在重復(fù)性差的問題。傳感器法有著快速無損的優(yōu)點,然而其結(jié)果不夠準確。光譜法不僅快速無損,且準確度高,近年來在肉品摻假檢測方面得到越來越廣泛的應(yīng)用。高光譜成像技術(shù)作為光譜法的一種,不僅具有光譜技術(shù)的常規(guī)優(yōu)點,而且較其他光譜技術(shù)有著更加全面的信息。高光譜成像能夠以數(shù)百個波長同時對樣本連續(xù)成像,同步獲取樣本的光譜和圖像信息,有著數(shù)據(jù)量豐富、分辨率高的特點。但同時高光譜成像也存在光譜信息重疊、冗余的問題,需要通過特征波長的篩選來提升模型效率和精度。高光譜成像在無損檢測肉品摻假方面已有較多的應(yīng)用。Ropodi等利用高光譜成像結(jié)合 PLS-DA和LDA判別模型鑒別摻有豬肉的牛肉樣本,結(jié)果表明,兩種建模方法均可以較好地區(qū)分摻假樣本,識別率分別為98.48%和96.97%。Kamruzzaman等利用高光譜成像預(yù)測牛肉中摻馬肉含量,采用不同的方法處理光譜數(shù)據(jù)并建立偏最小二乘模型(PLS),模型預(yù)測集相關(guān)系數(shù)達到0.98。Wu等研究了高光譜預(yù)測蝦中摻假物明膠含量的可行性,使用無信息變量消除和連續(xù)投影法的組合篩選了佳波長,建立的LS-SVM模型預(yù)測集相關(guān)系數(shù)達0.965,并實現(xiàn)了蝦中明膠含量的分布可視化。上述研究證實了高光譜檢測肉品摻假的可行性,然而目前未見高光譜應(yīng)用到牛肉丸摻假檢測的報道。
根據(jù)唐穗平等的調(diào)查,豬肉和雞肉是市場上主要的牛肉丸摻假物。因此,利用高光譜成像系統(tǒng)采集摻有不同比例豬肉和雞肉的牛肉丸的信息,對光譜信息進行預(yù)處理后建立全波段偏最小二乘摻假含量量預(yù) 測模型,而后采用SPA、競爭性自適應(yīng)重加權(quán)算法、聯(lián)合區(qū)間偏最小二乘-競爭性自適應(yīng)重加權(quán)篩選特征波長,建立PLS摻假含量預(yù)測模型,以期為牛肉丸摻假快速檢測提供參考。
1.1 樣本制備
實驗所用牛腿肉、豬肉、雞腿肉、淀粉、調(diào)味料(食鹽、白糖、味精、黑胡椒粉、料酒)均購于鎮(zhèn)江麥德龍超市;肉彈素、谷氨酰胺轉(zhuǎn)氨酶(TG酶)均購于河南千志商貿(mào)有限公司。
肉丸制作配方:每1kg原料肉中加入淀粉100g、食鹽25g、白糖20g、肉彈素5g、味精4g、黑胡椒粉5g、TG酶5g、料酒20ml、水200ml。工藝流程:選料→清洗→瀝干→絞肉→斬拌→混料→煮制→冷卻→包裝。首先制作原料肉全部為牛肉的牛肉丸,再分別制作以牛肉糜混合不同比例豬肉糜和雞肉糜的牛肉丸,摻假肉占原料肉質(zhì)量比分別為5%,10%,15%,20%和25%??偣驳玫?1類樣本,每類樣本30個平行,共計330個樣本。
1.2 高光譜圖像采集
1.2.1 高光譜成像系統(tǒng)
采用的高光譜成像系統(tǒng)如圖1所示,由江蘇大學(xué)食品無損檢測實驗室自主研制。系統(tǒng)硬件部分主要包括CCD攝像機、150W光纖鹵素?zé)?、精密電控平移臺、電子控制箱和計算機等。軟件部分主要是SpectralCube。
1.2.2 高光譜成像數(shù)據(jù)采集與標(biāo)定
在高光譜數(shù)據(jù)采集之前先打開系統(tǒng)預(yù)熱30min,以減少基線漂移帶來的的影響。設(shè)置采集參數(shù):CCD攝像機曝光時間為45ms,圖像分辨率618*1628;光譜范圍為431~962nm,光譜波長間隔為0.858nm;電控平移臺移動速度為1.25m/s。采集時將牛肉丸樣本置于電控平移臺上,打開平移臺的同時點擊保存按鈕采集高光譜數(shù)據(jù),最終得到樣本的三維數(shù)據(jù)模塊。
高光譜數(shù)據(jù)采集過程易受光強不均勻和暗電流等影響,需要對獲取的原始圖像進行黑白板校正。校正公式如式(1)所示。
式中,R為校正后高光譜圖像;I為原始高光譜圖像;B 為黑板標(biāo)定圖像;W為白板標(biāo)定圖像。
1.3 數(shù)據(jù)處理方法
1.3.1 高光譜成像的光譜數(shù)據(jù)提取
利用ENVI軟件打開校正后牛肉丸樣本高光譜圖像,采用矩形工具選取每個樣本中心附近200像素*200像素的區(qū)域作為感興趣區(qū)域ROI,計算ROI內(nèi)所有像素點的光譜反射率的平均值作為此樣本的光譜數(shù)據(jù)。300個樣本共得到300條平均光譜,最終得到300*618的光譜數(shù)據(jù)集。
受環(huán)境條件和儀器運行等因素的影響,采得的信息中包含無用信息和噪聲。為了減少散射光和噪聲等影響,需要對光譜數(shù)據(jù)進行預(yù)處理。采用的預(yù)處理方法包括一階導(dǎo)數(shù)、二階導(dǎo)數(shù)、均值中心化、多元散射校正、卷積平滑、標(biāo)準正態(tài)變量變換。通過對比不同預(yù)處理方法所建立模型的效果,選取較佳預(yù)處理方法進行后續(xù)數(shù)據(jù)處理。
1.3.2 光譜特征波長篩選
光譜信息數(shù)據(jù)量巨大,且存在冗余信息。為了提高模型的效率和精度,對預(yù)處理后的光譜進行特征波長的篩選。采用連續(xù)投影法(SPA)、競爭性自適應(yīng)重加權(quán)算法(CARS)、聯(lián)合區(qū)間偏最小二乘法(SiPLS)和聯(lián)合區(qū)間偏最小二乘-競爭性自適應(yīng)重加權(quán)(SiPLS-CARS)四種篩選特征波長方法。SPA通過比較不同波長之間投影向量的大小,以投影向量最大的波長為待選波長,并用校正模型選擇特征波長。SPA可以使變量之間共線性最小化,很大程度上減少變量的個數(shù)。CARS通過蒙特卡羅采樣隨機抽取校正集的一部分樣本建立PLS模型,計算此次采樣中波長回歸系數(shù)的絕對值權(quán)重,再利用指數(shù)衰減函數(shù)去除絕對值較小的波長變量點,剩余的變量以其回歸系數(shù)的絕對值作為權(quán)重采用自適應(yīng)重加權(quán)采樣建立PLS模型并計算RMSECV,當(dāng)RMSECV最小時對應(yīng)變量即為選擇的特征波長。SiPLS先將全波段分為若干個子區(qū)間,然后通過計算從所有可能的區(qū)間組合模型中選擇出相關(guān)系數(shù)最大且RMSECV值最小的區(qū)間組合,是一種高效的篩選特征區(qū)間方法。本研究提出的SiPLS-CARS是聯(lián)用SiPLS和CARS進行波長篩選的一種方法,先利用SiPLS選擇最佳波長區(qū)間,再利用CARS從最佳區(qū)間中篩選特征波長。最后對不同波長篩選方法下建立的預(yù)測模型效果進行比較。
1.3.3 摻假含量預(yù)測模型
通過建立PLS模型預(yù)測牛肉丸摻假含量。PLS能夠充分提取數(shù)據(jù)的有效信息,解決變量共線性的問題,在光譜數(shù)據(jù)建模中應(yīng)用廣泛。PLS模型預(yù)測效果的評估指標(biāo)為校正集相關(guān)系數(shù)、預(yù)測集相關(guān)系數(shù)、交叉驗
證均方根誤差和預(yù)測均方根誤差。Rc和Rp越接近1,RMSECV和RMSEP越接近0時,模型的預(yù)測效果越好。
二 、結(jié)果與討論
2.1 光譜預(yù)處理
圖2(a)和圖3(a)分別為摻有豬肉和雞肉的牛肉丸樣本的原始光譜圖,圖2(b)和圖3(b)為對應(yīng)平均光譜圖(均含有純牛肉丸光譜)。從平均光譜圖中可以看出,不同摻假含量的樣本光譜曲線趨勢相近,但反射率存在差別,摻假量越大,反射率越大。純牛肉丸和摻有豬肉的樣本平均光譜在710nm處有反射峰,這主要與,O-H鍵的三級倍頻吸收有關(guān)。摻有雞肉樣本光譜在710nm處反射峰不如摻有豬肉樣本明顯,這是由于相比于豬肉,雞肉與牛肉的差別更大。從原始光譜圖中可以看出,當(dāng)樣本數(shù)量較大時,光譜曲線重疊嚴重,無法通過肉眼從光譜曲線上進行區(qū)分,此時需要進行數(shù)據(jù)處理以實現(xiàn)摻假量預(yù)測。
2.2 牛肉丸中摻假豬肉含量預(yù)測模型建立
2.2.1 全波段PLS模型
將不同預(yù)處理方法處理后的光譜以隨機分組的方式把180條豬肉摻假光譜的2/3劃分為校正集,1/3劃分為預(yù)測集。用PCA優(yōu)選前15個主成分,作為模型的輸入建立PLS摻假含量預(yù)測模型。模型的預(yù)測結(jié)果如表1所示,可以看出,光譜經(jīng)MSC預(yù)處理后建立的模型預(yù)測效果好,當(dāng)主成分數(shù)為15時,模型的Rc和Rp分別為0.9515和0.9481,RMSECV和RMSEP分別為0.0269和0.0261。
2.2.2 特征波長篩選
全波段光譜數(shù)據(jù)量大且有冗余信息,需要進行特征提取以簡化模型、提升模型效率。分別采用SPA,CARS,Si-PLS和SiPLS-CARS四種方法篩選特征波長。2.2.1已指出摻有豬肉的預(yù)測模型預(yù)處理方法是MSC,故對光譜數(shù)據(jù)進行MSC處理后進行特征波長篩選。
(1)SPA篩選特征波長
設(shè)置選擇特征波長數(shù)量范圍1~25,根據(jù)均方根誤差(RMSEC)選擇波長,選擇結(jié)果如圖4所示。圖4(a)和(b)分別表示RESE變化趨勢和篩選的特征波長具體位置。從圖4(a)中看出,當(dāng)波長數(shù)量從1增加到13時,均方根誤差的值程階梯狀下降,隨后趨于穩(wěn)定。選擇了13個特征波長(431.05,442.63,476.73,502.69,522.89,555.88,742.60,786.19,864.10,878.14,903.59,927.31和948.39nm),占全波段的2.1%,特征波長具體位置如圖4(b)所示。
(2)CARS篩選特征波長
CARS篩選波長的過程如圖5所示。采樣次數(shù)設(shè)置為100次,圖5(a)為變量個數(shù)隨采樣次數(shù)的變化趨勢,隨著采樣次數(shù)增加,選擇的波長數(shù)量逐漸減少,先快減后緩慢。圖5(b)為RMSECV隨采樣次數(shù)變化趨勢,一開始RMSECV緩慢減小,說明一些無關(guān)變量在采樣過程中被去除。而后RMSECV階梯上升,一些關(guān)鍵變量被去除。圖5(c)顯示采樣次數(shù)為44時,RMSECV小,此時共篩選了51個特征波長,占全波段的8.25%。
(3)SiPLS篩選波長
將預(yù)處理后的全光譜劃分為10~25個子區(qū)間,分別聯(lián)合2,3和4個子區(qū)間,以RMSECV最小原則優(yōu)選特征子區(qū)間組合。圖6顯示了聯(lián)合子區(qū)間的位置。從圖中可以看出,當(dāng)把全光譜分為14個子區(qū)間,聯(lián)合第1,3,7,13子區(qū)間時,RMSECV最小。每個子區(qū)間包含45個波長,因此共篩選180個特征波長,占全波段的29.13%。
(4)SiPLS-CARS篩選特征波長
SiPLS-CARS通過聯(lián)用SiPLS和CARS實現(xiàn)特征波長的選擇。將SiPLS篩選所得波長區(qū)間作為新數(shù)據(jù),進行CARS波長篩選,結(jié)果如圖7所示。從圖中可以看出,當(dāng)采樣次數(shù)為9時,篩選出32個特征波長,占全波段的5.18%。
2.2.3 特征波長下PLS模型結(jié)果
不同特征波長篩選方法的PLS模型結(jié)果如表2所示??梢钥闯?,CARS篩選波長后建立的模型預(yù)測效果佳,模型的Rc和Rp分別為0.9814和0.9721,RMSECV和RMSEP分別為0.0163和0.0203。SPA雖然減少了特征波長數(shù)量,但模型的預(yù)測效果不如全波段下預(yù)測效果。Si-PLS篩選特征區(qū)間后模型精度沒有得到提升,這是因為所提取的變量是連續(xù)的,相鄰或者相互之間可能會存在高度相關(guān)性。SiPLS-CARS相比于SiPLS不僅有效地縮減了特征波長數(shù)量,而且提高了模型預(yù)測的精度;相比于CARS篩選波長更少,但精度略低。CARS波長篩選后模型,可以說明CARS可以有效去除無關(guān)變量。SiPLS-CARS作為一種新的特征波長篩選方法需要在更多實際應(yīng)用中測驗其實用性。
2.3 牛肉丸中摻雞肉含量預(yù)測模型建立
2.3.1 全波段下PLS模型結(jié)果
牛肉丸中摻雞肉全波段PLS建模方法同2.2.1,結(jié)果如表3所示。摻雞肉含量預(yù)測結(jié)果總體優(yōu)于摻豬肉結(jié)果,這是因為雞肉與牛肉差異更大。經(jīng)1stDer預(yù)處理后建立的模型預(yù)測效果好,當(dāng)主成分數(shù)為14時,模型的Rc和Rp分別為0.9861和0.9807,RMSECV和RMSEP分別為0.0143和0.0165。
2.3.2 特征波長的篩選
利用SPA篩選了15個特征波長(439.32,448.43,461.72,467.55,473.39,493.46,504.37,591.63,622.44,695.72,,704.38,726.08,768.74,922.04和952.78nm),占全波段的2.43%。CARS篩選了61個特征波長,占全波段的9.87%。SiPLS選擇的區(qū)間組合為:將全光譜分為14個子區(qū)間,聯(lián)合第7,8,11,12四個子區(qū)間,共180個特征波長,占全波段的29.13%。SiPLS-CARS篩選了28個特征波長,占全波段的4.53%。
2.3.3 特征波長下PLS模型結(jié)果
不同特征波長篩選方法的PLS模型結(jié)果如表4所示。與摻豬肉預(yù)測結(jié)果類似,CARS篩選波長后建立的模型預(yù)測效果佳。此時,模型的Rc和Rp分別為0.9902和0.9878,RMSECV和RMSEP分別為0.0123和0.0126。這表明CARS在牛肉丸高光譜摻假檢測中能夠較好地去除無關(guān)變量、提升模型效率和精確度,可結(jié)合PLS模型用于實際檢測。不同波長篩選方法對牛肉丸中摻雞肉含量預(yù)測趨勢上與摻含量豬肉基本相同。
三、結(jié)論
利用高光譜成像進行牛肉丸摻豬肉和雞肉檢測研究。首先采用不同預(yù)處理方法建立全波段下PLS模型并比較得出預(yù)處理方法,然后用不同方法篩選特征波長建立PLS模型。結(jié)果表明:(1)在1stDer,2ndDer,MC,MSC,SG和SNVT預(yù)處理方法中,牛肉丸摻豬肉和雞肉PLS預(yù)測模型預(yù)處理方法分別為MSC和2ndDer。(2)在SPA,CARS,Si-PLS和SiPLS-CARS四種特征波長篩選方法中,牛肉丸摻豬肉和雞肉PLS預(yù)測模型方法均為CARS,分別篩選了51和61個特征波長。此時,摻豬肉PLS預(yù)測模型Rc和Rp分別為0.9814和0.9721,RMSECV和RMSEP分別,0.0163和0.0203。摻雞肉PLS預(yù)測模型Rc和Rp分別為0.9902和0.9787,RMSECV和RMSEP分別為0.0123和0.0126。摻雞肉預(yù)測模型效果整體好于摻豬肉。研究表明采用高光譜成像技術(shù)可以實現(xiàn)牛肉丸摻豬肉和雞肉含量預(yù)測,可為快速無損檢測牛肉丸摻假提供理論基礎(chǔ)。
來源:高光譜成像的牛肉丸摻假檢測:孫宗保,王天真,李君奎,鄒小波" ,梁黎明,劉小裕{光譜學(xué)與光譜分析 第40卷第7期}