玉米穗腐病是影响玉米产量、品质和粮食安全的重要病害之一。由于病斑在玉米穗表面呈高度不均匀分布,传统人工目测分级容易受到经验差异影响,常规 RGB 图像也难以准确识别早期病斑、霉层覆盖及颜色相近的复杂病变区域。对于抗病种质筛选、QTL 定位和全基因组关联分析(GWAS)而言,能否获得客观、连续、可量化的高精度表型数据,是影响后续抗病基因挖掘和育种利用效率的关键因素。

2026 年 6 月 9日,北京科技大学现代农学院万向元团队在 Food Research International(TOP1区期刊,IF:8.85) 发表题为“Accurate detection of full-surface ear rot in maize using hyperspectral imaging and deep learning”的研究论文。该研究面向玉米穗腐病全表面精准检测需求,构建了集线扫高光谱成像、同步旋转控制、ORB-RANSAC 非冗余裁剪、机器学习/深度学习建模和病斑表型参数输出于一体的自动分析体系,为玉米穗腐病无损检测和高通量表型分析提供了新的技术方案。
穗腐病籽粒在果穗中呈现不规律分布,因此获取果穗全表面图像是实现穂腐病染病程度精准定量的基础。该研究结合线扫高光谱成像和果穗匀速旋转控制机构,采集了 50 个健康、125 个中度感染和 130 个重度感染的玉米果穗全表面高光谱图像。其中,78 张全表面图像用于像素标注和模型构建,剩余 227 张图像用于模型预测结果的可视化评估。共获得 413,359 个标注像素,包含 113,929 个病变像素和 299,430 个健康像素,为像素级病斑识别模型提供了可靠数据基础。
(1)构建线扫-同步旋转全表面高光谱采集系统,实现玉米穗病斑非冗余获取:针对单视角成像存在背面盲区、多序列成像容易产生重叠冗余的问题,研究团队设计了由旋转机构、线扫高光谱相机和计算机控制系统组成的玉米穗全表面高光谱成像平台。样品在双滚轮结构驱动下同步旋转,相机逐线扫描,从而覆盖玉米穗完整表面,获得包含空间信息和光谱信息的三维数据立方体(图1)。

图 1 玉米穗腐病全表面高光谱检测总体技术路线
在全表面采集过程中,为保证覆盖完整,系统会进行超过 360° 的冗余扫描,原始图像首尾区域存在重叠。为解决这一问题,研究提出 ORB-RANSAC 非冗余裁剪方法:先基于 460、560 和 660 nm 波段生成 RGB 图像并进行灰度增强,再利用 ORB 特征点进行初步匹配,随后通过 RANSAC 几何验证剔除误匹配点,并以几何一致性得分确定最优裁剪线。定量评估显示,人工裁剪线位置为 620.03 ± 42.59 px,ORB-RANSAC 裁剪线位置为 623.29 ± 43.15 px,二者 Pearson 相关系数达到 0.9987,R² 为 0.9973,平均绝对误差为 3.51 px,所有图像绝对误差均不超过 10 px,说明该方法能够稳定获得结构完整、无明显重复的全表面展开图(图2)。

图 2 基于 ORB-RANSAC 的玉米穗全表面非冗余裁剪与校准流程
(2)解析健康与病变像素光谱差异,筛选玉米穗腐病敏感特征波段:采集 420–950 nm 范围内 514 个波段的像素级光谱数据,并对原始光谱进行 Savitzky-Golay(SG)、标准正态变量变换(SNV)及 SG-SNV 组合预处理。光谱响应分析显示,健康与病变玉米穗在可见光区和近红外区均存在差异,病变样本在 420–560 nm 区间整体反射率较高,可能与籽粒色素、霉层覆盖以及组织结构改变有关(图3)。

图 3 健康与病变玉米穗的光谱反射特征
为降低高维光谱冗余并提升建模效率,进一步比较 CARS、VIP 和遗传算法(GA)三种特征波段筛选方法。结果表明,三类方法筛选出的波段在 478.89–506.78 nm 和 917.97–944.83 nm 区间存在共同分布,尤其在 478、495、505、925 和 940 nm 附近表现出较高一致性。综合分类效果看,GA 筛选的 253 个特征波段更有利于模型识别,其中 GA-RF 组合测试集总体准确率达到 93.85%,为后续深度学习模型输入提供了更优特征基础。
(3)系统比较机器学习与深度学习模型,CNN-Bi-LSTM 实现最优像素级检测:研究分别构建 SVM、RF、XGBoost 三种传统机器学习模型,以及 CNN、Bi-LSTM、CNN-Bi-LSTM 三种深度学习模型,对健康像素和穗腐病病变像素进行二分类识别。在全波段光谱建模中,SG 预处理后的 RF 模型表现较优,测试集总体准确率为 93.88%,灵敏度为 98.82%,Kappa 系数为 0.8556,说明传统机器学习模型对病变区域具有一定判别能力(图4)。
进一步比较深度学习模型后发现,CNN-Bi-LSTM 混合模型综合表现最佳。该模型将 CNN 的局部特征提取能力与 Bi-LSTM 对光谱序列双向依赖关系的建模能力结合起来,能够更充分挖掘高光谱数据中的深层病理响应信息。在 20 次随机种子重复实验中,CNN-Bi-LSTM 的平均总体准确率达到 95.61 ± 0.36%,平均准确率为 96.02 ± 0.32%,Kappa 系数为 0.8933 ± 0.0084,F1-score 为 0.9241 ± 0.0058,整体优于 CNN、Bi-LSTM 及传统机器学习模型(图4)。

图 4 六种分类模型在玉米穗腐病检测中的混淆矩阵
(4)实现病斑热图可视化与本地软件部署,形成从数据采集到表型输出的闭环流程:为了检验模型在整穗图像上的定位能力,研究将训练后的 CNN-Bi-LSTM 模型应用于 227 张未参与标注建模的全表面高光谱图像。可视化结果显示,模型预测热图中的高响应区域与肉眼可见的感染区域高度对应,叠加结果能够较清晰地显示病斑在玉米穗表面的空间分布,表明模型识别结果主要来自病变籽粒的真实光谱响应,而非边缘、阴影或背景噪声(图5)。

图 5 CNN-Bi-LSTM 模型对玉米穗腐病病斑区域的热图可视化
在此基础上,研究团队开发了 PC 端表型检测软件 Ear Rot Analyzer。软件界面包括数据导入与管理、图像可视化和定量分析三个模块,可支持单个玉米穗特征提取和多样本批量处理,并依次显示原始图像、裁剪图像、分割掩膜和检测叠加结果。系统能够自动输出 patch area、packing density、patch kernel area、patch lesion area、lesion area ratio 和 kernel damage rate 等 6 项表型参数,并以 CSV 格式保存,便于后续数据管理、统计分析和育种研究调用(图6)。

图 6 Ear Rot Analyzer 玉米穗腐病表型检测软件界面
综上,该研究围绕玉米穗腐病“看不全、分不准、量化难”的表型检测瓶颈,建立了全表面高光谱采集、非冗余展开、特征波段筛选、深度学习识别、病斑可视化和表型参数输出的一体化技术流程。与人工分级和常规 RGB 图像方法相比,该体系能够更客观地定位和量化玉米穗腐病病斑区域,为抗病种质筛选、抗性相关遗传研究和高通量植物表型平台建设提供了数据基础与工具支撑。后续在进一步扩大品种、年份和环境条件验证,该方法有望在玉米穗腐病抗性评价和智能育种场景中发挥更大作用。
北京科技大学现代农学院研究生姚雪颖为论文第一作者,万向元教授、田喜副教授为论文共同通讯作者。该研究得到北京市科技新星计划、国家自然科学基金重点项目和生物育种国家科技重大专项等资助。
原文链接:https://doi.org/10.1016/j.foodres.2026.119658