變量選擇是構(gòu)建近紅外校正模型的關(guān)鍵環(huán)節(jié),直接影響預(yù)測結(jié)果的可靠性。中國煙草總公司鄭州煙草研究院研究生的相關(guān)研究突破了現(xiàn)有變量選擇算法在煙草化學(xué)成分(尤其是低含量成分)定量分析中存在的明顯局限性,創(chuàng)新性地提出了一種融合異常變量剔除、加權(quán)懲罰和變量聚合策略的魯棒變量選擇算法,顯著提升了煙草近紅外定量分析模型的預(yù)測準(zhǔn)確度和穩(wěn)定性。
此項研究成果發(fā)表于分析化學(xué)學(xué)科國際頂級期刊《Analytical Chemistry》(中科院1區(qū)Top期刊,Nature Index收錄期刊,影響因子6.8),并榮膺當(dāng)期封面文章。鄭州院2022級碩士研究生李蓓蓓為論文第一作者,煙草化學(xué)研究室趙樂研究員和郭軍偉正高級工程師為論文通訊作者。
該研究基于煙草近紅外光譜特征,以模型集群分析(Model-Population Analysis, MPA)框架為基礎(chǔ),結(jié)合波長點和波長區(qū)間變量選擇算法思想,建立了異常值去除-權(quán)重懲罰與聚合(Outlier Removal with Weight Penalization and Aggregation, OR-WPA)新型變量選擇算法。該算法能夠識別與目標(biāo)化學(xué)成分密切相關(guān)的特征變量,剔除不相關(guān)或冗余特征,有效提高煙草低含量成分近紅外預(yù)測模型的預(yù)測準(zhǔn)確度和穩(wěn)定性。將該算法成功應(yīng)用于加熱卷煙基材中具有相似吸收基團的化學(xué)成分和玉米中常量成分的定量分析,驗證了OR-WPA算法在實際生產(chǎn)場景中的有效應(yīng)用。