近期,中國(guó)科學(xué)院合肥物質(zhì)院智能所謝成軍與張潔團(tuán)隊(duì)提出了一種基于因果推斷的農(nóng)作物害蟲(chóng)識(shí)別方法。相關(guān)研究成果發(fā)表在農(nóng)林科學(xué)領(lǐng)域國(guó)際權(quán)威期刊Pest Management Science上。
害蟲(chóng)的精確識(shí)別是智慧農(nóng)業(yè)不可或缺的一環(huán),它對(duì)于確保作物的健康生長(zhǎng)、提升產(chǎn)量與品質(zhì),以及保持生態(tài)平衡至關(guān)重要。隨著計(jì)算機(jī)視覺(jué)技術(shù)的飛速進(jìn)步,深度學(xué)習(xí)方法在害蟲(chóng)識(shí)別領(lǐng)域已經(jīng)展現(xiàn)出巨大的潛力和顯著的優(yōu)勢(shì)。然而,現(xiàn)有識(shí)別技術(shù)面臨著一個(gè)核心難題:難以適應(yīng)害蟲(chóng)訓(xùn)練集的分布偏差問(wèn)題。由于圖像采集工作多在特定環(huán)境下進(jìn)行,導(dǎo)致訓(xùn)練數(shù)據(jù)集中存在大量背景相似的樣本,這可能使模型在訓(xùn)練過(guò)程中過(guò)度依賴背景特征,而非害蟲(chóng)的關(guān)鍵特征。當(dāng)測(cè)試數(shù)據(jù)的分布與訓(xùn)練數(shù)據(jù)不一致時(shí),模型的識(shí)別準(zhǔn)確性便可能大幅下降。
為了克服上述挑戰(zhàn),研究團(tuán)隊(duì)提出了一種創(chuàng)新的解耦特征學(xué)習(xí)(Decoupled Feature Learning, DFL)框架。DFL框架的設(shè)計(jì)理念是應(yīng)用因果推斷技術(shù),以解決訓(xùn)練數(shù)據(jù)集的偏差問(wèn)題。該框架首先通過(guò)不同的樣本采樣策略構(gòu)建多樣化的訓(xùn)練域,以減少模型對(duì)原始訓(xùn)練數(shù)據(jù)集固有分布偏差的依賴,并降低無(wú)關(guān)特征的干擾。接著,利用中心三元損失(Center Triplet Loss)來(lái)加強(qiáng)和優(yōu)化模型在不同域中捕捉類別核心特征的能力。通過(guò)在Li數(shù)據(jù)集、小樣本害蟲(chóng)數(shù)據(jù)集(DFSPD)以及大規(guī)模害蟲(chóng)數(shù)據(jù)集IP102上的廣泛測(cè)試,DFL框架顯著提升了現(xiàn)有基線分類模型的性能,在三個(gè)數(shù)據(jù)集上分別取得了95.33%,92.59%,和74.86%的最佳識(shí)別準(zhǔn)確率。此外,可視化結(jié)果也證實(shí)了DFL框架能夠鼓勵(lì)模型學(xué)習(xí)到類別的核心特征,即使在測(cè)試數(shù)據(jù)分布發(fā)生偏移時(shí)也能保持穩(wěn)定的優(yōu)越性能,從而證明了其在緩解數(shù)據(jù)分布偏差問(wèn)題、增強(qiáng)深度學(xué)習(xí)在農(nóng)業(yè)領(lǐng)域可靠性方面的重要作用。
該項(xiàng)研究工作是中國(guó)科學(xué)院合肥物質(zhì)院智能所與安徽省農(nóng)科院經(jīng)信所合作完成,所使用的害蟲(chóng)圖像樣本由農(nóng)科院經(jīng)信所董偉副研究員提供和協(xié)助整理。
碩士生胡濤為論文第一作者,謝成軍、董偉為論文通訊作者,張潔、顏科宇等團(tuán)隊(duì)成員為論文算法設(shè)計(jì)思路、部分實(shí)驗(yàn)和論文撰寫(xiě)做出了貢獻(xiàn)。該項(xiàng)工作得到了國(guó)家自然科學(xué)基金、安徽省自然科學(xué)基金、合肥物質(zhì)院院長(zhǎng)基金等科研項(xiàng)目的支持。
圖1 DFL框架結(jié)構(gòu)
圖2 Li dataset及DFSPD數(shù)據(jù)集實(shí)驗(yàn)結(jié)果
圖3 DFSPD 數(shù)據(jù)集可視化結(jié)果對(duì)比