變量選擇是構建近紅外校正模型的關鍵環(huán)節(jié),直接影響預測結果的可靠性。中國煙草總公司鄭州煙草研究院研究生的相關研究突破了現有變量選擇算法在煙草化學成分(尤其是低含量成分)定量分析中存在的明顯局限性,創(chuàng)新性地提出了一種融合異常變量剔除、加權懲罰和變量聚合策略的魯棒變量選擇算法,顯著提升了煙草近紅外定量分析模型的預測準確度和穩(wěn)定性。
此項研究成果發(fā)表于分析化學學科國際頂級期刊《Analytical Chemistry》(中科院1區(qū)Top期刊,Nature Index收錄期刊,影響因子6.8),并榮膺當期封面文章。鄭州院2022級碩士研究生李蓓蓓為論文第一作者,煙草化學研究室趙樂研究員和郭軍偉正高級工程師為論文通訊作者。

該研究基于煙草近紅外光譜特征,以模型集群分析(Model-Population Analysis, MPA)框架為基礎,結合波長點和波長區(qū)間變量選擇算法思想,建立了異常值去除-權重懲罰與聚合(Outlier Removal with Weight Penalization and Aggregation, OR-WPA)新型變量選擇算法。該算法能夠識別與目標化學成分密切相關的特征變量,剔除不相關或冗余特征,有效提高煙草低含量成分近紅外預測模型的預測準確度和穩(wěn)定性。將該算法成功應用于加熱卷煙基材中具有相似吸收基團的化學成分和玉米中常量成分的定量分析,驗證了OR-WPA算法在實際生產場景中的有效應用。

黨建領航 產業(yè)筑基 重慶中煙書寫“農業(yè)強、農村美、農民富”新篇章