基于改進YOLOv3-Tiny的番茄苗分級檢測.pdf
第38卷 第1期 農(nóng) 業(yè) 工 程 學 報 Vol 38 No 1 2022年 1月 Transactions of the Chinese Society of Agricultural Engineering Jan 2022 221 基于改進YOLOv3 Tiny的番茄苗分級檢測 張秀花1 2 靜茂凱1 2 袁永偉1 2 尹義蕾3 李 愷3 王春輝3 1 河北農(nóng)業(yè)大學機電工程學院 保定 071000 2 河北省智慧農(nóng)業(yè)裝備技術創(chuàng)新中心 保定 071000 3 農(nóng)業(yè)農(nóng)村部規(guī)劃設計研究院設施農(nóng)業(yè)研究所 北京 100125 摘 要 為了提高番茄苗分選移栽分級檢測精度 該研究提出了YOLOv3 Tiny目標檢測改進模型 首先建立了番茄穴盤 苗數(shù)據(jù)集 使用K means 算法重新生成數(shù)據(jù)集錨定框 提高網(wǎng)絡收斂速度和特征提取能力 其次為目標檢測模型添加 SPP空間金字塔池化 將穴孔局部和整體特征融合 提高了對弱苗的召回率 同時加入路徑聚合網(wǎng)絡 PANet 提升細 粒度檢測能力 引入了SAM空間注意力機制 提高對番茄苗的關注 減少背景干擾 增加了ASFF Adaptively Spatial Feature Fusion 自適應特征融合網(wǎng)絡 能夠使目標檢測模型對多個級別的特征進行空間濾波 采用CIoU損失函數(shù)策略 提高模 型收斂效果 改進的YOLOv3 Tiny目標檢測模型經(jīng)過數(shù)據(jù)集訓練 在測試集上能夠達到平均精度均值為97 64 相比 YOLOv3 Tiny模型提高了3 47個百分點 消融試驗驗證了網(wǎng)絡結構改進和訓練策略是有效的 并將改進的YOLOv3 Tiny 目標檢測算法與5種目標檢測算法進行對比 發(fā)現(xiàn)改進的YOLOv3 Tiny目標檢測模型在重合度閾值為50 的條件下平均 精度均值為97 64 單張圖像處理時間為5 03 ms 較其他目標檢測算法具有明顯的優(yōu)勢 驗證了該模型能夠滿足番茄 苗分級檢測精度要求 可以為幼苗分選檢測方法提供參考 關鍵詞 機器視覺 圖像處理 穴盤育苗 幼苗分級 目標檢測 YOLOv3 Tiny 自適應特征融合 doi 10 11975 j issn 1002 6819 2022 01 025 中圖分類號 S24 TP389 1 文獻標志碼 A 文章編號 1002 6819 2022 01 0221 09 張秀花 靜茂凱 袁永偉 等 基于改進YOLOv3 Tiny的番茄苗分級檢測 J 農(nóng)業(yè)工程學報 2022 38 1 221 229 doi 10 11975 j issn 1002 6819 2022 01 025 http www tcsae org Zhang Xiuhua Jing Maokai Yuan Yongwei et al Tomato seedling classification detection using improved YOLOv3 Tiny J Transactions of the Chinese Society of Agricultural Engineering Transactions of the CSAE 2022 38 1 221 229 in Chinese with English abstract doi 10 11975 j issn 1002 6819 2022 01 025 http www tcsae org 0 引 言 2020年中國蔬菜播種面積達2 086 27萬hm2 產(chǎn)量 72 102萬t 1 2 穴盤育苗是蔬菜規(guī)模化生產(chǎn)的重要環(huán)節(jié) 商品化穴盤苗出售前 一般要進行分選 剔除缺苗和弱 苗 用健康苗補換 形成整齊均勻的壯苗 3 5 然而目前 工廠化育苗的分選工作以手工為主 耗時費力 難以滿 足大規(guī)模工廠化育苗生產(chǎn) 5 6 研究自動化穴盤苗分選技 術具有重要意義 而運用機器視覺進行穴盤苗等級劃分 是實現(xiàn)自動化分選的重要手段 穴盤苗移栽視覺識別早期采用傳統(tǒng)的圖像處理方 式 Tai 7 等開發(fā)了輔助機械手移植的機器視覺系統(tǒng) 引 導機械手將健康苗移栽到空的穴盤孔 任燁 8 通過增強圖 像色差后進行閾值分割的方法 實現(xiàn)了對穴盤幼苗生長 狀態(tài)的采集 蔣煥煜等 9 采用分水嶺算法分割方法處理幼 苗葉片邊緣重疊的問題 童俊華等 10 通過改進型的分水 嶺算法進行了幼苗的健康識別 馮青春等 11 12 通過統(tǒng)計 各個穴孔里面的幼苗占用的像素數(shù)量判斷對應穴孔里面 是否為優(yōu)質(zhì)幼苗 采用線結構光視覺系統(tǒng)對穴盤苗的高 收稿日期 2021 10 30 修訂日期 2021 12 31 基金項目 河北省重點研發(fā)計劃 20327207D 河北省引進留學人員資助 項目 C20200336 作者簡介 張秀花 博士 教授 研究方向為機械設計與理論 現(xiàn)代園藝生 產(chǎn)裝備技術 Email zhang72xh 度進行了測量 得到的穴盤苗高度誤差在5mm以內(nèi) 胡 飛等 13 測量得到了單連通區(qū)域法的修正函數(shù) 降低了面 積統(tǒng)計的誤差 荷蘭VISSER國際貿(mào)易與工程公司利用 CCD相機識別不健康的幼苗和空的穴盤孔 邱碩等 14 建 立了瓜類幼苗的識別定量判斷基準 通過葉片的顏色信 息和形狀特征對瓜類幼苗進行健康識別 孫國祥等 15 對 15 25 d的番茄穴盤苗圖像存在的番茄苗葉面重疊問題 進行葉面分割 進行了逐層篩選真實分割拐點 張志遠 等 16 實現(xiàn)了雙目視覺技術對高差突變的拐點進行分離 提高了子葉分離的正確率 于亞波等 17 通過對穴盤幼苗 圖像進行預處理實現(xiàn)背景分離 對提取的圖像進行形心 位置的提取 能夠使幼苗的識別率在92 以上 彭曙等 18 對番茄苗幼苗的莖稈圖像進行通道分離 王永維等 19 通 過對苗齡25 35 d的擬南芥穴盤苗通過行像素坐標變化 和列坐標變化的情況 確定每一個穴盤孔的邊界以及中 心坐標位置 根據(jù)每個穴孔的分割后的像素值能夠?qū)崿F(xiàn) 對無苗和有苗的穴孔100 識別率 張寧等 20 通過正視圖 和俯視圖圖像提取幼苗的葉面積 株高 株莖等信息生 成數(shù)據(jù)集 訓練隨機森林分級算法 對幼苗的質(zhì)量進行 分級 最終算法的準確率為93 3 以上文獻主要依靠閾 值分割的預處理方法對穴盤苗進行處理 通過統(tǒng)計像素 值信息判斷穴盤苗的生長狀態(tài) 隨著計算機技術和深度學習算法的發(fā)展 卷積神經(jīng) 網(wǎng)絡開始逐漸在穴盤苗檢測識別上應用 張勇等 21 將卷 農(nóng)業(yè)工程學報 http www tcsae org 2022年 222 積神經(jīng)網(wǎng)絡LeNet 5應用到穴盤苗的識別過程中 通過把 穴盤苗圖像拆分為單獨的穴孔圖像 擴充數(shù)據(jù)集完成數(shù) 據(jù)集構建 最終穴盤苗識別準確率達到98 7 何艷 22 等提出將采集到的煙草穴盤苗采用AdaBoost煙苗分割方 法 通過提取的Haar矩形特征和積分圖以及級聯(lián)分類器 對煙草穴盤格進行訓練 最終能夠?qū)崿F(xiàn)對煙草穴盤格的 分割準確率達到 100 通過 MLP Multi Layer Perceptron 建立識別模型和CNN訓練模型的對比 CNN Convolutional Neural Network 模型對穴盤苗格的識別率 更高 達97 58 對穴盤格的分割結果進行多個特征進 行識別與標記 最終能夠?qū)崿F(xiàn)煙草的壯苗準確率達 99 05 相比于傳統(tǒng)的圖像處理識別方式 卷積神經(jīng)網(wǎng) 絡不僅準確率高 而且在處理過程中不需要應用到閾值 分割的處理方式 穩(wěn)定性較高 因此本文使用卷積神經(jīng) 網(wǎng)絡進行番茄穴盤苗分級的研究 YOLOv3 Tiny是YOLOv3的輕量化版本 雖然檢測 速度高 但是檢測精度較低 為了解決番茄苗分選移栽 過程中的番茄苗分級檢測的智能化水平 兼顧檢測速度 和準確率 提出了一種基于改進的YOLOv3 Tiny番茄穴 盤苗分級檢測方法 引入多種特征融合機制增加目標檢 測模型對番茄穴盤苗的注意力 減輕對背景的關注并提 高對番茄穴盤苗的細粒度檢測 對番茄穴盤苗的自動化 檢測和分選提供方法參考 1 圖像采集與數(shù)據(jù)集制作 番茄穴盤苗為2020年8月中旬在永清縣農(nóng)業(yè)農(nóng)村部規(guī) 劃設計研究院國家設施農(nóng)業(yè)研究中心培育 品種為Fortesa RZ F1雜交種番茄 苗齡10 d時使用分辨率為1 920 1 080 像素的Kinect v2相機進行圖像采集 隨機對其中的540株 番茄穴盤苗的葉展進行測量 測量結果如圖1所示 圖1 番茄穴盤苗葉展的測量結果 Fig 1 Measurement results of leaf spread of tomato plug seedlings 通過圖1 可以看出 該類番茄穴盤苗的真葉葉展 子葉葉展和子葉與真葉葉展的商均符合正態(tài)分布 真葉 葉展主要分布區(qū)間為24 36 mm 子葉葉展主要分布區(qū) 間為30 60 mm 子葉與真葉葉展之商的主要分布區(qū)間 為1 26 2 34 參考相關的研究和規(guī)范 23 24 并根據(jù)市場通 用做法和番茄苗生長情況 將番茄穴盤苗分為三級 即 1 空穴 穴盤孔中的種子未發(fā)芽或幼苗太弱小沒有 培養(yǎng)價值 2 弱苗 穴盤苗子葉和真葉的葉展之商大于1 8或 子葉的葉展小于30 mm或真葉的葉展小于24 mm 3 壯苗 穴盤苗子葉和真葉的葉展之商小于1 8 同時滿足子葉的葉展大于30mm 真葉的葉展大于24mm 基于以上分選標準 并根據(jù)穴孔被相鄰穴盤葉片遮 擋以及其他因素的干擾情況 對采集到的番茄穴盤苗的 分選示例如圖2 所示 將采集到的番茄穴盤苗圖片進行 分割 分割后共計2 160張單個的番茄穴盤苗圖像 使用 在 Github 平臺 上 的開 源工 具 LabelImg 理 生成XML格式的數(shù)據(jù)集文件 無干擾 Without disturbance 葉片邊緣干擾 Leaf edge disturbance 葉片干擾 Leaf disturbance 土壤雜質(zhì)干擾 Soil impurities interference a 無苗 a No seedings 無干擾 Without disturbance 葉片邊緣干擾 Leaf edge disturbance 葉片交叉干擾 Leaves cross disturbance 子葉不對稱 Cotyledon asymmetry b 弱苗 b Weak seedings 無干擾 Without disturbance 葉片邊緣干擾 Leaf edge disturbance 葉片交叉干擾 Leaves cross disturbance 子葉不對稱 Cotyledon asymmetry c 壯苗 c Strong seedings 圖2 穴盤苗不同級別 Fig 2 Different levels of plug seedlings 為了增加圖像信息 基于數(shù)據(jù)增強庫albumentations 對原始數(shù)據(jù)進行數(shù)據(jù)增強 對數(shù)據(jù)同時使用旋轉(zhuǎn)和翻轉(zhuǎn) 的方式生成包含25 080張圖像的數(shù)據(jù)集 如表1所示 表1 訓練集和測試集樣本數(shù)量 Table 1 The number of training and test set samples 數(shù)據(jù)集 Data set 壯苗 Strong seedings 弱苗 Weak seedlings 無苗 No seedlings 合計 Total 訓練集 Training set 10 000 6 400 6 400 22 800 測試集 Test set 1 000 640 640 2 280 2 改進YOLOv3 Tiny目標檢測模型的搭建 2 1 YOLOv3 Tiny卷積神經(jīng)網(wǎng)絡 YOLOv3是YOLO系列的第三代 該目標檢測算法 的骨干網(wǎng)絡在Darknet 19的基礎上加入了殘差模塊 最 終升級為Darknet 53 網(wǎng)絡結構中借鑒了FPN特征金字 第1期 張秀花等 基于改進YOLOv3 Tiny的番茄苗分級檢測 223 塔結構 提高了算法對不同尺度信息提取特征的能力 最終分為3個檢測層進行目標的檢測 YOLOv3 Tiny網(wǎng) 絡是YOLOv3的輕量化版本 具有精簡 實時性高和高 檢測精度的特點 該網(wǎng)絡在骨干網(wǎng)絡中采用7 層卷積層 和最大池化層的網(wǎng)絡提取特征 并且移除了YOLOv3中 的殘差網(wǎng)絡 在檢測層中將YOLOv3的3個檢測層縮減 為了2個 因此YOLOv3 Tiny目標檢測模型的骨干網(wǎng)絡 較淺 不能有效提取深層次的語義信息 檢測精度不能 滿足番茄穴盤苗分選要求 本文改進YOLOv3 Tiny的特 征提取方式 引入注意力機制 引入更加充分的特征融 合機制和錨定框聚類等 對YOLOv3 Tiny進行改進和增 強 加強YOLOv3 Tiny目標檢測模型的特征提取和特征 融合能力 2 2 YOLOv3 Tiny目標檢測模型改進 2 2 1 SPP空間金字塔池化 YOLOv3 Tiny中雖然有FPN作為特征融合結構 但是 對葉面積較小的弱苗特征提取不夠充分 檢測精度依然較 低 存在漏檢與錯檢的情況 為了提高弱苗的檢測精度 在YOLOv3 Tiny的骨干網(wǎng)絡后面引入SPP 25 空間金字塔池 化結構 對番茄穴盤苗特征進行局部特征和全局特征的融 合 構建的SPP模塊的結構如圖3所示 同時對輸入SPP 模塊的特征圖進行池化核為13 13 9 9 5 5的最大池化 并將生成的特征圖與輸入的特征圖進行融合 圖3 SPP池化金字塔結構 Fig 3 SPP pooling pyramid structure 2 2 2 引入PANet網(wǎng)絡結構 為了提高骨干網(wǎng)絡特征提取和融合的能力 參考Liu 等 26 提出的路徑聚合網(wǎng)絡PANet 將骨干網(wǎng)絡結構中產(chǎn) 生張量變化的特征圖進行融合 將2 個預測尺度的特征 圖分別與骨干網(wǎng)絡引出的融合特征圖在維度上進行疊 加 實現(xiàn)對不同尺度特征圖的充分融合與利用 最終在 P1和P2輸出特征圖 實現(xiàn)低層次特征層中的細節(jié)信息對 目標定位 如圖4所示 改進后在FPN的基礎上增加了 細節(jié)信息流動的支路 低層次信息只需要較少的網(wǎng)絡層 就可以實現(xiàn)與高層次語義信息的融合 注 MCBL代表最大池化 Maxpool 卷積 convolutional 批正則化 Batch Norm Leaky Relu激活函數(shù) CBL表示卷積 convolutional 批正則化 Batch Norm Leaky Relu激活函數(shù) SPP代表空間金字塔池化 Upsample表示上采樣 Note MCBL stands for Maxpool convolutional Batch Norm Leaky Relu CBL stands for convolutional Batch Norm Leaky Relu SPP stands for spatial pyramid pooling and Upsample stands for upsampling 圖4 應用的PANet結構 Fig 4 The PANet structure applied 2 2 3 引入SAM空間注意力機制 SAM空間注意力機制能夠提高網(wǎng)絡模型對番茄穴盤 苗的關注度 減少基質(zhì)土和穴盤邊緣的背景干擾 提升 模型檢測精度 SAM空間注意力機制 27 首先對輸入的特 征圖F做基于通道的全局最大池化和全局平均池化并將 獲得的特征圖進行疊加 生成的特征圖經(jīng)過卷積運算和 sigmoid激活函數(shù)之后與輸入的特征圖對應元素相乘生成 空間注意力特征 該機制的工作原理如式 1 所示 7 7 max S Ss augM F f F F 1 式中Ms F 表示空間注意力圖 SaugF 表示對空間上特征的 平均化操作 maxSF 表示對空間上特征的最大池化操作 f 表示將兩個特征拼接后的卷積操作 表示sigmoid激活 函數(shù) 表示通道拼接操作 圖5為搭建的SAM機制結 構 特征圖與PANet網(wǎng)絡融合后輸出P1和P2 經(jīng)過CBLo 層的卷積運算分別形成特征圖F1和F2 F1和F2分別與 P1和P2的特征圖進行相乘運算 輸出特征圖再次進行 CBLo卷積 輸出P1 和P2 即為經(jīng)過空間注意力機制的特 征圖 農(nóng)業(yè)工程學報 http www tcsae org 2022年 224 注 P1 P2代表特征圖輸入 CBLo代表卷積 批正則化 Logistic激活函數(shù) F1 F2代表經(jīng)過卷積生成的特征圖 P1 和P2 代表輸出的特征圖 Note P1 and P2 represent feature map input CBLo represents convolutional Batch Norm Logistic activation function F1 and F2 represent feature maps generated by convolution and P1 and P2 represent output feature maps 圖5 基于Darknet實現(xiàn)的SAM空間注意力機制 Fig 5 SAM spatial attention mechanism based on Darknet implementation 2 2 4 自適應特征融合網(wǎng)絡 為了解決YOLOv3 Tiny網(wǎng)絡結構在不同尺度上不 一致性的問題 在多尺度檢測階段引入了自適應特征 融合 28 的方法 抑制尺度之間的不一致性 提高網(wǎng)絡 對番茄穴盤苗檢測的準確性 圖6為基于Darknet框 架實現(xiàn)的ASFF自適應特征融合網(wǎng)絡 以ASFF 1為 例 在SAM空間注意力機制中輸出P1 和P2 特征圖 后 P2 通過卷積的方式對特征圖進行下采樣 使P1 和P2 的特征圖一致 隨后使P1 與P2 的特征圖融合 融合后的特征圖通過卷積層 調(diào)整形成通道數(shù)為1 尺度為13 13的特征圖 并分別與P1 和下采樣后的 P2 進行相乘運算 將運算的結果通過殘差連接輸出為 P1 同理 對ASFF 2的運算方式則是對P1 進行上 采樣 然后進行運算 注 CLo代表卷積 Logistic激活函數(shù) 其余同上 Note CLo stands for Convolution Logistic activation function the rest are the same as above 圖6 基于darknet實現(xiàn)的ASFF自適應特征融合網(wǎng)絡 Fig 6 ASFF adaptive feature fusion network based on darknet 2 2 5 算法的位置回歸損失函數(shù) 在YOLOv3 Tiny中采取IoU損失函數(shù)作為位置回歸 損失計算 但是當預測框與真實框沒有重疊區(qū)域時 IoU 損失函數(shù)不僅無法衡量兩者邊界框之間的距離 而且無 法提供任何可以提供傳遞的梯度 為了優(yōu)化位置回歸損 失函數(shù) 研究過程中利用Zheng等 29 提出的CIoU損失函 數(shù)提高回歸速度 CIoU損失函數(shù)綜合考慮了邊界框之間 的重疊面積 距離 尺度變化以及長寬比等的幾何因素 邊界框的回歸相比IoU穩(wěn)定性得到了提高 CIoU損失函 數(shù)的計算公式為 2 2 CIoU IoU gtB Bc 2 式中 2 gtB B 代表預測框與真實框的中心點之間的歐 氏距離 代表權重 代表衡量長寬比一致性的參數(shù) c 代表同時包含預測框和真實框的最小矩形區(qū)域的對角 線距離 本文算法采用CIoU損失函數(shù)作為邊界框定位的 損失函數(shù)如式 3 loc CIoU 2 2 1 CIoU 1 IoU gt L L B B c 3 式中Lloc代表算法的位置回歸損失函數(shù) LCIoU代表CIoU 位置回歸損失函數(shù) 2 2 6 錨定框的聚類與優(yōu)化 YOLOv3 Tiny目標檢測模型的錨定框經(jīng)coco和voc 數(shù)據(jù)集聚類得到 本文研究對象為番茄穴盤苗數(shù)據(jù)集 為 提高錨定框利用率并提高模型收斂速度 使用K means 算法對番茄穴盤苗數(shù)據(jù)集進行聚類 以獲得適應番茄穴盤 苗數(shù)據(jù)集的錨定框 采用平均重疊度對聚類分析結果進行 評判 如圖7a所示 當錨定框數(shù)量為6時 平均重疊度達 到85 52 之后趨于平穩(wěn) 為平衡重疊度與網(wǎng)絡復雜度 將聚類數(shù)為6作為網(wǎng)絡中的錨定框尺寸 聚類云圖如圖7b 所示 此時的錨定框尺寸分別為 169 166 305 209 213 309 345 269 282 338 385 382 將聚類結果按照大小順序分配到13 13 26 26 兩個預測尺度 每個尺度分配3個錨定框 圖7 平均重疊度與聚類云圖 Fig 7 Average intersection over union AIOU with clustered cloud diagrams 最終改進的YOLOv3 Tiny目標檢測模型如圖8所示 第1期 張秀花等 基于改進YOLOv3 Tiny的番茄苗分級檢測 225 圖8 改進后的YOLOv3 Tiny目標檢測模型 Fig 8 Improved YOLOv3 Tiny target detection model 3 試驗結果與分析 3 1 模型訓練 3 1 1 訓練參數(shù) 硬件環(huán)境為GeForce RTX 3060 GPU 顯存為12 GB 安裝的NVIDA顯卡驅(qū)動 分別為CUDA 11 1和cudnn v8 2 1 32 CUDA是NVIDA推出的GPU并行計算框架 該框架能夠在NVIDA GPU上運行 滿足復雜計算 cudnn 為NVIDA推出的專門應用于深度神經(jīng)網(wǎng)絡的GPU加速 器 軟件運行環(huán)境選用Windows10操作系統(tǒng) Opencv 3 4 開源視覺庫 采用Visual Studio 2017進行編譯 參數(shù)設置 在訓練過程中 目標檢測模型的網(wǎng)絡輸 入尺寸為416 416 每次迭代訓練的樣本數(shù)量為64 共2 批次 進行18 000次迭代 動量因子設為0 9 衰減學習 率設為0 001 當網(wǎng)絡迭代10 800 12 600 14 400和16 200 次時 學習率依次降低為0 000 1 0 000 01 0 000 001 和0 000 000 1 3 1 2 評價指標 目標檢測模型的評價指標為準確度 Precision P 和召回率 Recall R 為了度量準確度和召回率在 實際檢測過程中的表現(xiàn)能力 本文使用平均精度均值 Mean Average Precision mAP 和F1值作為評價模型 效果的綜合評估指標 計算公式為 TP 100 TP FPP 4 TP 100 TP FNR 5 10AP 100 P RdR 6 1 1mAP AP 100 n i in 7 1 2 100 PRF P R 8 式中n為檢測目標的類別數(shù)量 i為某一具體的類別 TP 為正樣本被正確預測的數(shù)量 TN為負樣本被正確預測的 數(shù)量 FP為正樣本被錯誤預測的數(shù)量 FN為負樣本被錯 誤預測的數(shù)量 3 2 消融試驗結果 消融試驗 30 通常應用在復雜的神經(jīng)網(wǎng)絡中 用于探 究網(wǎng)絡的特定子結構或者訓練策略及訓練參數(shù)對模型產(chǎn) 生的影響 在神經(jīng)網(wǎng)絡結構的設計過程中具有重要指導 意義 本文在YOLOv3 Tiny基礎上 在骨干網(wǎng)絡之后引 入空間金字塔池化結構 SPP 使用路徑聚合網(wǎng)絡 PANet 進行更加充分的特征信息融合 在頸部網(wǎng)絡增 加了注意力機制 提高對提取的特征進行重點區(qū)域關注 預測層的損失函數(shù)修改為CIoU損失函數(shù)訓練 為了驗證 改進效果 設置了消融試驗 將改進的YOLOv3 Tiny目 標檢測模型中的改進機制或策略逐個刪除并進行訓練 驗證目標檢測模型中的機制或策略改進是否具有積極意 義 表2 中以消融試驗過程中每個目標檢測模型的平均 精度均值為指標進行排序 表2 消融試驗結果 Table 2 Ablation experiment results ID FPN SPP PANet SAM ASFF CIoU mAP 1 94 17 2 94 56 3 96 73 4 96 88 5 97 35 6 97 64 注 FPN代表特征金字塔結構 SPP代表空間金字塔池化 PANet代表路徑 聚合網(wǎng)絡 SAM代表空間注意力機制 ASFF代表自適應特征融合網(wǎng)絡 CIoU代表CIoU損失函數(shù) mAP代表平均精度均值指標 表示當前的網(wǎng)絡 模型中使用該結構或者策略 表示當前的網(wǎng)絡模型中未使用該結構或策略 Note FPN stands for feature pyramid structure SPP stands for spatial pyramid pooling PANet stands for path aggregation network SAM stands for spatial attention mechanism ASFF stands for adaptive feature fusion network CIoU stands for CIoU loss function mAP stands for mean Average Precision evaluation index stands for This structure or strategy is used in the current network model and means that the structure or strategy is not used in the current network model 如表2所示第1組試驗為YOLOv3 Tiny目標檢測模 型的結果 對番茄穴盤苗分級檢測的mAP為94 17 第 2 組試驗在YOLOv3 Tiny 目標檢測模型基礎上增加了 SPP池化金字塔結構 mAP為94 56 相比第1組提高 了0 39個百分點 第3組在第2組的基礎上引入了PANet 路徑聚合網(wǎng)絡 相比第2組目標檢測模型mAP提高了2 17 個百分點 第4組在第3組的基礎上引入了空間注意力 農(nóng)業(yè)工程學報 http www tcsae org 2022年 226 SAM模塊 比第3組目標檢測模型mAP提高了0 15個 百分點 第5組在第4組的基礎上增加了ASFF自適應特 征融合網(wǎng)絡 檢測精度比第4組提高了0 47個百分點 第6組在第5組的基礎上引入了CIoU損失函數(shù) 比第5 組的mAP提高了0 29個百分點 比原始的YOLOv3 Tiny 提高了3 47個百分點 通過消融試驗發(fā)現(xiàn) 對目標檢測 模型的改進均有積極效果 而PANet路徑聚合網(wǎng)絡的引 入對目標檢測模型檢測準確率提升最明顯 3 3 YOLOv3 Tiny改進前后的對比結果 YOLOv3 Tiny和改進的YOLO3 Tiny目標檢測模型 的測試結果如圖9 所示 本次試驗設定的置信度閾值為 0 25 通過圖9可以發(fā)現(xiàn) 對于無苗穴孔檢測情況 當穴 孔沒有出現(xiàn)干擾的情況下 改進的YOLOv3 Tiny 和 YOLOv3 Tiny 均能有較好的檢測效果 改進后 YOLOv3 Tiny的置信度會高于YOLOv3 Tiny 但是穴孔 出現(xiàn)葉片和土壤雜質(zhì)干擾時 YOLOv3 Tiny目標檢測算 法的置信度出現(xiàn)了明顯的降低 而改進后的 YOLOv3 Tiny 受到的干擾后置信度依然遠遠高于 YOLOv3 Tiny 對弱苗穴孔的檢測情況 YOLOv3 Tiny 受到子葉不對稱干擾較大 葉片邊緣和葉片交叉的干擾 較小 而改進后的YOLOv3 Tiny則均能達到較高的檢測 置信度 對于壯苗穴孔檢測情況 YOLOv3 Tiny雖然對 子葉不對稱和葉片交叉干擾有較高的檢測置信度 但是對 子葉不對稱的樣本出現(xiàn)了誤檢 改進后的YOLOv3 Tiny 基本沒有受到影響 YOLOv3 Tiny對數(shù)據(jù)集檢測的平均重 疊度為78 52 而改進后的YOLOv3 Tiny則為78 81 改進后的YOLOv3 Tiny對于番茄穴盤苗的無苗 弱苗和 壯苗三種類別的檢測準確度分別提高了5 20 個百分點 3 53個百分點和0 04個百分點 較YOLOv3 Tiny目標檢 測模型有明顯的提升 通過對比可以發(fā)現(xiàn)改進后的 YOLOv3 Tiny 對穴盤苗的檢測效果遠遠強于 YOLOv3 Tiny 圖9 兩種目標檢測模型的檢測對比 Fig 9 Detection comparison between the two target detection models 兩種目標檢測模型的檢測結果的P R曲線如圖10所 示 圖中曲線與橫縱坐標圍成的區(qū)域面積即為該類別檢 測的準確率 可以發(fā)現(xiàn)無論是對壯苗 弱苗還是無苗的 檢測 改進的YOLOv3 Tiny目標檢測模型的PR曲線均 在YOLOv3 Tiny的外側(cè) 檢測的準確率更高 能夠發(fā)現(xiàn) 其性能明顯強于YOLOv3 Tiny目標檢測模型 圖10 兩種目標檢測模型的P R曲線 Fig 10 The P R curve of the two target detection models 第1期 張秀花等 基于改進YOLOv3 Tiny的番茄苗分級檢測 227 3 4 不同算法的對比試驗 使用同樣的數(shù)據(jù)集對其他的5 種目標檢測算法進行 訓練 在得到最佳權重之后 在同樣的測試集上進行測 試 最終對6 種目標檢測算法或模型在不同的重合度指 標上進行F1值 mAP和AP值的計算 結果如表3所示 當重疊度閾值為50 的情況下 改進后的YOLOv3 Tiny 目標檢測算法 Improved YOLOv3 Tiny 的mAP和各項 AP值均高于其他目標檢測算法 平均F1值指標則對比 其他算法差距不大 改進后的YOLOv3 Tiny目標檢測算 法的單張圖片的檢測時間為5 03 ms 而對比試驗中的大 型目標檢測算法檢測時間最短的YOLOv3為13 42 ms 改進后的YOLOv3 Tiny 比YOLOv3 檢測時間縮短了 8 39 ms 能夠滿足使用的要求 但是當重疊度閾值為75 時 改進后的YOLOv3 Tiny相較于大型的目標檢測算法 檢測精度并不是很理想 但是和Faster RCNN以及輕量化 的YOLOv3 Tiny目標檢測算法相比 依然有較高的檢測 精度 因此在重疊度閾值為50 的情況下 改進之后的 YOLOv3 Tiny具有較好的應用效果 表3 6種算法在測試集上的測試結果 Table 3 Test results of the six algorithms on the test set 平均精度 Average Precision 檢測算法 Detection algorithm 重合度閾值 IoU Threshold F1值 F1 score 平均精度均值 Mean Average Precision 檢測時間 Detection time ms 壯苗 Strong seedling 弱苗 Weak seedings 無苗 No seedings 50 94 10 91 44 92 70 86 23 96 39 Faster RCNN 75 84 00 73 09 57 15 64 82 63 13 91 31 50 92 10 94 71 93 02 91 16 99 95 YOLOv3 Tiny 75 73 20 65 55 2 94 65 72 60 32 70 62 50 95 00 96 50 95 96 93 84 99 71 YOLOv4 75 88 00 86 99 15 52 79 30 82 11 99 56 50 93 60 97 08 97 20 94 02 100 YOLOv3 75 86 90 86 66 13 42 79 97 80 35 99 84 50 94 10 97 17 97 30 94 20 100 CenterNet 75 84 00 87 71 27 5 86 16 77 42 99 55 50 94 00 97 64 98 22 94 69 99 99 Improved YOLOv3 Tiny 75 85 50 83 76 5 03 79 06 72 36 99 85 4 結 論 本文以番茄穴盤苗為研究對象 以YOLOv3 Tiny目 標檢測模型為基礎 結合番茄穴盤苗分選的實際情況 對YOLOv3 Tiny目標檢測模型進行了改進 最終搭建了 改進的YOLOv3 Tiny目標檢測模型并進行了試驗分析和 評價 結論如下 1 改進了 YOLOv3 Tiny 目標檢測模型 在 YOLOv3 Tiny目標檢測模型的骨干網(wǎng)絡后面加入了SPP 空間金字塔池化結構 使用PANet結構提升了原來的FPN 特征金字塔 使用CIoU損失函數(shù)替代IoU損失函數(shù) 加 入SAM空間注意力機制和ASFF自適應特征融合網(wǎng)絡 2 基于采集和數(shù)據(jù)增強后的25 080張圖片 對改進 的YOLOv3 Tiny目標檢測模型進行試驗 結果表明 改 進后的YOLOv3 Tiny 目標檢測算法的平均精度均值為 97 64 F1值為94 00 在YOLOv3 Tiny的基礎上分 別提高了3 47個百分點和1 90個百分點 3 通過消融試驗證明對YOLOv3 Tiny目標檢測模 型的改進效果 通過改進后的 YOLOv3 Tiny 與 YOLOv3 Tiny Faster RCNN和CenterNet等目標檢測算 法的對比試驗 結果表明改進后的YOLOv3 Tiny目標檢 測算法檢測精度在重疊度閾值為50 的條件下平均精度 均值為97 64 F1值為94 00 優(yōu)于其他目標檢測算 法 此時改進后的YOLOv3 Tiny目標檢測模型對壯苗 弱苗和無苗的檢測平均精度分別為98 22 94 69 和 99 99 對單張圖片檢測時間為5 03 ms 較試驗中檢測 時間最短的大型目標檢測算法降低了8 39 ms 具有明顯 的速度優(yōu)勢 參 考 文 獻 1 張俊杰 張西群 彭發(fā)智 等 蔬菜工廠化播種育苗技術 及應用前景 J 河北農(nóng)業(yè)科學 2013 17 4 20 23 Zhang Junjie Zhang Xiqun Peng Fazhi et al The vegetable industralized sowing seedling technology and its application prospect J Journal of Hebei Agricultural Sciences 2013 17 4 20 23 in Chinese with English abstract 2 劉明池 季延海 武占會 等 我國蔬菜育苗產(chǎn)業(yè)現(xiàn)狀與 發(fā)展趨勢 J 中國蔬菜 2018 1 11 1 7 Liu Mingchi Ji Yanhai Wu Zhanhui et al Current situation and development trend of vegetable seedling industry in our country J China Vegetables 2018 1 11 1 7 in Chinese with English abstract 3 Ting K C Giacomelli G A Ling P P Workability and productivity of robotic plug transplanting workcell J In Vitro Cellular 2 Hebei Smart Agricultural Equipment Technology Innovation Center Baoding 071000 China 3 Institute of Protected Agriculture Academy of Agricultural Planning and Engineering Ministry of Agriculture and Rural Affairs Beijing 100125 China Abstract Here an improved YOLOv3 Tiny target detection model was proposed to enhance the detection accuracy of the seedling classification and detection in the process of tomato seedling transplanting First