《渔业现代化》2024年第5期

发布时间:2024-9-30 | 杂志分类:其他
免费制作
更多内容

《渔业现代化》2024年第5期

第 5 期 林礼群等:大型养殖工船氧锥设计与运行效果试验氧锥为研究对象,通过设计并搭建氧锥试验系统,模拟水池进行增氧试验,获取氧锥的稳定高效运行参数,以期为大型养殖工船增氧设备的工程设计与运行提供参考。1 增氧原理氧锥增氧过程属于氧传质过程。 根据双膜理论与菲克定律[15-17],氧由气相向液相传递过程中,液膜氧传质微分方程为:dCdt= KLa(cs- C) (1)式中:C 是与增氧时间 t 对应的水中的溶氧质量浓度(mg / L);KLa 是测试水温条件下的氧质量转移系数(h-1);cs 是水中饱和溶氧质量浓度(mg /L)。将式(1)积分得:In(cs- C) = In(cs- c0 ) - KLa·t (2)式中:c0 是在试验开始时水中的溶氧质量浓度(mg / L);t 是试验的时间(min)。将 KLa 转换为标准参考温度 20 ℃ 的氧质量转移系数 KLas,即:KLas= KLa·θ(20-T)(3)式中:T 是试验期间的水温(℃ );θ 是温度校正因子,取 1. 024。增氧能力也称标准氧传质速率[16,22],可表示如下:Qs= KLas·(Cs20- c0 )·V... [收起]
[展开]
《渔业现代化》2024年第5期
粉丝: {{bookData.followerCount}}
文本内容
第51页

第 5 期 林礼群等:大型养殖工船氧锥设计与运行效果试验

氧锥为研究对象,通过设计并搭建氧锥试验系统,

模拟水池进行增氧试验,获取氧锥的稳定高效运

行参数,以期为大型养殖工船增氧设备的工程设

计与运行提供参考。

1 增氧原理

氧锥增氧过程属于氧传质过程。 根据双膜理

论与菲克定律[15-17]

,氧由气相向液相传递过程

中,液膜氧传质微分方程为:

dC

dt

= KLa(cs

- C) (1)

式中:C 是与增氧时间 t 对应的水中的溶氧质量

浓度(mg / L);KLa 是测试水温条件下的氧质量转

移系数(h

-1

);cs 是水中饱和溶氧质量浓度(mg /

L)。

将式(1)积分得:

In(cs

- C) = In(cs

- c0 ) - KLa·t (2)

式中:c0 是在试验开始时水中的溶氧质量浓度

(mg / L);t 是试验的时间(min)。

将 KLa 转换为标准参考温度 20 ℃ 的氧质量

转移系数 KLas,即:

KLas

= KLa·θ

(20-T)

(3)

式中:T 是试验期间的水温(℃ );θ 是温度校正因

子,取 1. 024。

增氧能力也称标准氧传质速率[16,22]

,可表示

如下:

Qs

= KLas·(Cs20

- c0 )·V·10

3 = KLas·9. 09·

V·10

3

(4)

式中:Qs 是增氧能力,表征单位时间内向溶氧质

量浓度为 0 的水中传递的氧气质量( kg / h);cs20

是 20 ℃的饱和溶氧质量浓度值(mg / L);20 ℃ 和

标准大气压下的溶氧质量浓度值为 9. 09 mg / L;V

是试验用水体积(m

3

)。

动力效率 Es 为:

Es

= Qs

/ P (5)

式中:Es 为消耗单位有用功所传递到水中的氧气

质量[ kg / ( kW· h)];P 是增氧过程电机功率

(kW)。

2 材料与方法

2. 1 氧锥装置

大型养殖工船封闭养殖舱增氧系统与循环水

养殖氧锥增氧系统组成基本相同(图 1),但由于

养殖水体成数量级增大,单个养殖舱水体 5 600

m

3

,养殖大黄鱼密度约 20 kg / m

3

,大黄鱼平均耗

氧率为 0. 188 8 g / ( kg·h)

[18-20]

,不考虑养殖舱

中其他耗氧,每个养殖舱单位时间耗氧量至少为

21. 15 kg / h。

图 1 工船养殖舱增氧系统及氧锥尺寸

Fig . 1 Oxygenation system of aquaculture vessel cabin and speece cone size

49

第52页

渔 业 现 代 化 2024 年

由于氧锥的尺度设计缺乏相关标准,在相同进

气量不变情况下,若氧锥设计尺度较小,氧锥能提

供给气液混合的空间小,气液接触时间短,混合不

充分,氧气利用率不高;若氧锥的设计尺度过大,氧

锥安装空间与增氧管系布置工程量大。 因此,结合

养殖工船实际情况,氧锥的主体尺寸设计为:容积

1. 35 m

3

,锥体高度 2. 9 m,锥度 22. 8°,底部直径

1. 2 m。 根据氧锥增氧试验获取氧锥的增氧能力,

确定每个养殖舱所需要配套的氧锥数量。

2. 2 材料

如图 2 所示,使用水循环系统进行试验。 氧

锥模型 1 个,容积为 1. 35 m

3

,锥体高度 2. 9 m,锥

度 22. 8°, 玻 璃 钢 材 质 制 成, 工 作 压 力 ≤ 0. 35

MPa;试验水池 1 个,圆形锥底,直径 10 m,水池高

度 1. 7 m;离心水泵 1 台,型号 125CLH-19Z,额定

流量 150 m

3

/ h,工作压力≤0. 3 MPa,电机有用功

率为 7. 6 kW;溶氧仪 3 台,型号 YSI ProQuatro,测

量范围 0~50 mg / L,分辨率 0. 01 mg / L,用于测量

水池溶氧浓度,并显示工作大气压和试验环境温

度;进出水管长约 15 m,管径 0. 15 m;气体流量计

1 个,型号 LUXZ020 ,集流量、压力、温度检测功

能于一体,流量范围 1. 2 ~ 15. 0 m

3

/ h;液体流量

计 1 个,DN75 电磁流量计,4 ~ 20 mA+485 通讯,

压力等级 1. 6 MPa,测量氧锥进水流量;压力表 1

个,量程 0~1 MPa,显示氧锥工作压力;纯氧氧气

罐若干瓶,压力 13. 5 MPa,纯度 99. 5%,40 L / 瓶;

亚硫酸钠数袋,工业纯,25 kg / 袋,作试验用水除

氧剂,用量一般为 100 g / m

3

;氯化钴 3 瓶,(CoCl

2

·6H2O,分析纯)100 g / 瓶,作试验用水消氧的催

化剂,用量一般为 2 g / m

3















 

 













 





图 2 氧锥增氧试验系统及主要试验材料

Fig. 2 Speece cone oxygenation test system and main test materials

2. 3 试验方法

试验在农业农村部渔业装备与工程技术重点

实验室开展,所有试验都是在没有鱼的情况下使

用洁净淡水(0‰盐度)进行。 试验水深 1. 3 m,试

验用水体积 103 m

3

。 氧锥溶氧性能试验按照文

献[21-22]进行。 设置 3 个取样点,固定好溶氧

50

第53页

第 5 期 林礼群等:大型养殖工船氧锥设计与运行效果试验

仪探头于水池中,每个探头相差 120°。 氧气进气

管阀门保持关闭,全开度打开氧锥出口阀门,调整

好水泵进水管和氧锥出水管浸没深度,不允许变

动位置与深度。 当所有试验装置仪器进入工作状

态,将氯化钴试剂按规定量均匀撒入水池中,将亚

硫酸钠按规定量均匀加入水池中,一旦除氧剂耗

尽水中的所有氧气,开启离心水泵,调整氧锥出口

阀门开度,保证离心泵与氧锥的安全工作压力,记

录水泵运行流量、氧锥工作压力、进气流量、环境

气压和水温。 待溶氧出现稳定上升时开始记录,

并观察出水口气泡大小及是否有肉眼可见的大量

气泡冒出。 溶氧仪记录的时间间隔为 0. 5 min,

3 台溶氧仪读数必须保持同步。 当溶氧质量浓度

超过 75%饱和时,立即停止试验。 若测量氧锥超

饱和溶氧度,增加记录时长直至溶氧质量浓度 3

min 变化在 5%内则停止试验。 本研究中的所有

试验数据均基于 3 次测量的平均值。 利用这些试

验的结果,绘制溶氧质量浓度随时间的变化曲线,

然后分析其关系,以确定氧锥溶氧性能及各运行

参数对氧锥溶氧的影响。

3 结果与分析

3. 1 氧锥增氧性能对比分析

在氧锥操作压力 0. 2 MPa、氧气进气流量 7. 5

m

3

/ h、水温 16 ℃的条件下,开展氧锥超饱和溶氧

度试验,发现水池中溶氧质量浓度接近饱和值后,

继续供氧,水池的溶氧质量浓度继续上升达到超

饱和度。 在开始增氧至 40 min,水池中溶氧质量

浓度均值达到 40 mg / L(如图 3,溶氧仪实时显

示),超饱和溶氧度接近 400%,验证了本研究设

计的氧锥能实现超饱和溶氧,超饱和溶氧质量浓

度值高于 30 mg / L

[7-8]

。 根据不同时刻溶氧质量

浓度的记录,得出在氧锥平均增氧能力为 25. 65

kg / h,平均动力效率为 3. 42 kg / (kW·h),如表 1

所示,其增氧能力显著高于其他典型增氧设备,动

力效率也高于大部分增氧设备,说明该氧锥增氧

与节能效果良好。 需要说明的是不同尺寸的氧锥

配套不同形式、不同功率的水泵产品,其增氧能力

存在很大的差异。 因此,氧锥在水产养殖实际应

用中,在其结构尺寸、进气位置、气液流量比等结

构及运行参数方面仍然存在较大优化空间,达到

高效增氧的同时更节能,以促进氧锥增氧设备在

水产养殖的规范化应用。

图 3 试验阶段记录最大的溶氧浓度

Fig. 3 Record the maximum dissolved oxygen concentration

during the experiment

表 1 氧锥装置和其他增氧装置增氧性能比较

Tab. 1 Comparison of oxygenation performance between speece cone and other oxygenation devices

增氧设备 增氧能力 Qs

/ (kg / h) 动力效率 Es

/ [kg / (kW·h)] 数据来源

氧锥 25. 65 3. 42 本试验

射流自吸式增氧机(0. 75 kW) 0. 83 1. 09 文献[23]

射流式增氧机 0. 2~1. 2 0. 24~0. 45 文献[24]

气提式增氧机 0. 01~0. 078 0. 30~2. 36 文献[25]

U 型管曝气装置 0. 059~0. 207 2. 0~2. 1 文献[26]

微孔曝气增氧机 4. 49~5. 84 3. 02~3. 66 文献[27]

新型管式曝气增氧机 0. 068~0. 082 1. 70~2. 05 文献[28]

管式微孔增氧机 15. 00~34. 36 1. 0~8. 0 文献[29]

直线型微孔爆气扩散器 0. 008 7~0. 017 4 4. 15~6. 87 文献[30]

叶轮式增氧机(3. 0 kW) 3. 31~4. 96 1. 10~1. 65 文献[31]

水车式增氧机(3. 0 kW) 6. 95~8. 48 2. 31~2. 83 文献[31]

涌浪式增氧机(1. 5 kW) 1. 51~2. 51 1. 00~1. 67 文献[31]

曝气式增氧机(2. 2~11 kW) 4. 97~64. 90 2. 26~8. 65 文献[31]

51

第54页

渔 业 现 代 化 2024 年

3. 2 操作压力对氧锥溶氧性能影响分析

在氧气进气流量 7. 5 m

3

/ h,进气管压力 198

kPa 的情况下,不同氧锥操作压力条件下,溶氧质

量浓度随时间变化如图 4 所示。

     

/ ZffB C Y

ffiF ffi

C  f 

(  f 

  

1FBSTPOT  

 

A  

/ ZffB C Y

ffiF ffi

C  f

(  f

  

1FBSTPOT  

 

A  

/ ZffB C Y

ffiF ffi

C  f 

(  f 

  

1FBSTPOT  

 

A  

/ ZffB C Y

ffiF ffi

C  f 

(  f 

  

1FBSTPOT  

 

A  

/ ZffB C Y

ffiF ffi

C  f 

(  f 

  

1FBSTPOT  

 

A  

           

           









 NH-









 NH-









 NH-









 NH-









 NH-

 .1B

 .1B  .1B

 .1B  .1B

图 4 不同压力条件下溶氧质量浓度随时间变化的线性拟合曲线

Fig. 4 Linear fitting curve of dissolved oxygen concentration over time under different operating pressures

根据线性拟合曲线的斜率知:试验氧锥操作压

力范围内(0. 07~0. 25 MPa),氧气浓度随着压力增

长较快。 标准氧质量转移系数在 9. 76 ~ 57. 5 h

-1

之间,根据图 5 所示,平均标准氧质量转移系数呈

缓慢增大趋势,增长变化不显著。 平均增氧能力

Qs 在 25. 65 ~27. 15 kg / h 范围,氧锥操作压力对其

增氧能力影响不大。 根据单个养殖舱单位时间耗

氧量不低于 21. 15 kg / h 要求,那么 1 个氧锥在该操

作条件下运行就能满足养殖溶氧量需求,即每个养

殖舱配置 1 个氧锥即可。 若大黄鱼养殖密度变化

较小,在不改变氧锥结构尺寸条件下适当调整氧气

进气量也能满足;若大黄鱼养殖密度变化较大,比

如密度变化 2 倍以上(或 0. 5 倍以下),则每舱增加

1 个氧锥(或者减小氧锥尺寸)。

52

第55页

第 5 期 林礼群等:大型养殖工船氧锥设计与运行效果试验

 .1B  .1B  .1B  .1B  .1B













图 5 不同压力下标准氧质量转移系数的箱线图

Fig. 5 Box plot of standard oxygen mass transfer coefficient

under different pressures

3. 3 不同压力下进气量范围分析

保持氧锥运行压力 0. 25 MPa 不变,氧气进

气流量进行变化( 0、7. 64、11. 20、13. 10、15. 00、

20. 10 m

3

/ h),随着氧气进气量的增大,水池中细

小气泡数量逐渐增加(图 6),当氧气进气量大于

15. 0 m

3

/ h 时,逐渐有大气泡冒出,说明部分氧气

以气泡析出水面,氧气利用率不佳。 结合养殖工

船需氧量分析,如果进气量低于 6. 5 m

3

/ h,其平

均增氧能力小于 22 kg / h,接近养殖舱的最小需氧

量 21. 15 kg / h,不能满足养殖舱的需氧量。 因此,

在氧锥运行压力 0. 25 MPa 件条件下,氧锥的氧

气进气量保持在 6. 5 ~15. 0 m

3

/ h 范围,有利于保

持产生细密气泡,保持较高氧气利用率,并且满足

养殖舱增氧需求。

B



 N I C



 N I

D



 N I E



 N I

F



 N I G



 N I

 

 

 

图 6 不同流量下氧锥出口出水池中气泡状态

Fig. 6 Bubble state in the outlet water tank of the speece cone under different flow rates

同理,通过开展不同压力下适宜的进气量范

围试验发现(表 2),虽然在相同进气量下,操作压

力对增氧能力影响不大,但是,不同的操作压力对

进气量影响显著,操作压力越大,在增大氧气进气

53

第56页

渔 业 现 代 化 2024 年

量条件下,越不容易形成大气泡析出水面,从而保

持较高的氧气利用率。 需要说明的是,本试验以

目测与拍照记录方式观察氧锥出口气液状态来判

定气泡尺寸大小与均匀性,以此分析氧气利用情

况,由于气泡大小实时测试条件不足,因此本试验

所获得的不同压力下进气量范围值会有不小偏

差,但是可以作为参考范围。

表 2 不同操作压力对应的氧气进气量运行范围

Tab. 2 Operating range of oxygen intake corresponding to

different operating pressures

氧锥运行压力/ MPa 进气量运行范围/ (m

3

/ h)

0. 07 6. 5~7. 5

0. 10 6. 5~8. 8

0. 15 6. 5~11. 3

0. 20 6. 5~13. 2

0. 25 6. 5~15. 0

4 结论

增氧是解决高密度水产养殖的必要手段,氧

锥因具有较好增氧性能在高密度水产养殖中常见

使用。 为实现养殖工船超大封闭水体及高密度养

殖的有效增氧,本研究以氧锥作为研究对象,建立

氧锥尺寸模型并开展增氧性能运行效果试验。 结

果显示:氧锥出口的溶氧能达到 40 mg / L,超饱和

溶氧接近 400%,实现超高饱和度溶氧;在氧气进

气量为 7. 5 m

3

/ h,氧锥操作压力为 0. 07 ~ 0. 25

MPa 条件下,增氧能力受操作压力影响不显著,

但是最佳进气量范围受操作压力影响显著,操作

压力越大,当氧气进气量增大时,越不容易形成大

气泡析出水面,保持较高的氧气利用率;在氧气进

气量大于 6. 5 m

3

/ h, 操作压力为 0. 07 ~ 0. 25

MPa,每个养殖舱配置 1 个该结构尺寸氧锥能满

足养殖舱氧量需求。 □

参考文献

[1] DONG S L,DONG Y W,CAO L,et al. Optimization of aquaculture sustainability through ecological intensification in China

[J]. Reviews in Aquaculture,2022,14(3):1249-1259.

[2] 张铮,高森,张泽扬. 基于特征构造预处理与 TCN-BiGRU 的

池塘溶解氧预测模型[J]. 上海海洋大学学报,2023,32(5):

943-952.

[3] 史文军,王盼,胡润豪,等. 低氧—复氧胁迫下脊尾白虾鳃组

织差异表达基因趋势分析[J]. 南方农业学报,2022,53(3):

735-747.

[4] MOULICK S,MAL B C,BANDYOPADHYAY S. Prediction of

aeration performance of paddle wheel aerators[ J]. Aquacultural

Engineering,2002,25(4):217-237.

[5] 陈润,王鲁民,王亚冰,等. 低氧和酸化胁迫对大黄鱼早期发

育阶段消化生理的影响[ J]. 海洋渔业,2021,43 ( 5):586

-594.

[6] 徐皓,刘晃,黄文超. 深远海设施养殖装备技术进展与展望

[J]. 上海海洋大学学报,2023,32(5):893-902.

[7] MICHAEL B T,JAMES M E. Recirculating Aquaculture[M].

New York:NRAC Publication ,2002.

[8] 宋奔奔,吴凡,倪琦,等. 封闭循环水养殖中曝气系统设计及

曝气器的选择[J]. 渔业现代化,2011,38(3):6-10.

[9] SPEECE R E. Hypolimnion aeration [ J ]. Journal American

Water Works Association,1971,63(1):6-9.

[10] MCGINNIS D F, LITTLE J C. Bubble dynamics and oxygen

transfer in a Speece cone[ J]. Water Science and Technology,

1998,37(2):285-292.

[11]陈有光,段登选,陈秀丽,等. 工厂化养鱼中氧气锥的增氧规

律[J]. 渔业现代化,2009,36(3):26-30.

[12]ASHLEY K,FATTAH K,MAVINIC D,et al. Analysis of design

factors influencing the oxygen transfer of a pilot - scale speece

cone hypolimnetic aerator [ J ]. Journal of Environmental

Engineering,2014,140(3):1-9.

[13]杨菁,管崇武,宋红桥,等. 循环水养殖系统氧锥运行参数设

计[J]. 渔业现代化,2023,50(2):1-6.

[14]王君,谢永和,李德堂,等. 养殖工船高压增氧锥外形优选及

配件开发[J]. 南方水产科学,2024(1):74-80.

[15] BARRUT B,BLANCHETON J P,CHAMPAGNEC J Y,et al.

Mass transfer efficiency of a vacum airlift—application to water

recycling in aquaculture systems[ J]. Aquacultural Engineering,

2012,46:18-26.

[16]KUMAR A, MOULICK S, SINGH B K, et al. Design

characteristics of pooled circular stepped cascade aeration system

[J]. Aquacultural Engineering,2013,56:51-58.

[17]孙东群. 标准 SC/ T 6009—1999《增氧机增氧能力试验方法》

中的数据处理[J]. 江苏农机化,2001(5):31-32.

[18]刘晃,徐皓,庄志猛. 封闭式养殖工船研发历程回顾[ J]. 渔

业现代化,2022,49(5):1-7.

[19]黄文超,赵新颖. 养殖工船建设运营经济效益分析[ J]. 中国

渔业经济,2024,42(1):72-82.

[20]李明云,苗亮,陈炯,等. 封闭式工船养殖大黄鱼容量的计算

及其评估[J]. 科学养鱼,2021(12):75-76.

[21]BOYD C E. Pond water aeration systems [ J ]. Aquacultural

Engineering,1998,18(1):9-40.

[22]SC/ T 6009—1999 增氧机增氧能力试验方法[S].

[23]吴世海. 射流自吸式增氧机[ J]. 农业机械学报,2007,38

(4):88-92.

[24]门涛,张祝利,顾海涛,等. 射流式增氧机性能研究[ J]. 渔业

现代化,2011,38(2):49-51,55.

54

第57页

第 5 期 林礼群等:大型养殖工船氧锥设计与运行效果试验

[25]潘强,张俊新,刘明泰,等. 气提式增氧曝气装置在海水养殖池中

的性能测定[J]. 大连海洋大学学报,2016,31(6):673-677.

[26 ] HEARN R. Gas transfer in air - lifts used to recirculate

aquaculture systems [ D]. US Louisiana Statc, Louisiana State

University,2009.

[27]钟伟. 微孔曝气式增氧机增氧性能试验 [ J]. 农业工程,

2019,9(12):83-87.

[28] ZHANG C L, SONG B B, SHAN J J, et al. Design and

optimization of a new tube aeration device [ J ]. Aquaculture

International,2020,28(3):985-999.

[29]管崇武,单建军,宋红桥,等. 管道式微孔增氧装置的增氧性

能研究[J]. 渔业现代化,2023,50(2):25-31.

[30]程香菊,谢宇宁,朱丹彤,等. 微孔扩散器形状对曝气增氧性

能影响的试验[J]. 农业工程学报,2017,33(16):226-233.

[31]钟伟,吴姗姗,韩梦遐,等. 水产养殖中传统增氧设备增氧能

力差异分析[J]. 渔业现代化,2024,51(1):39-47.

Engineering design and performance experiment of

speece cone for the aquaculture vessel

LIN Liqun,MA Fengshuang,ZHANG Yaoming,XU Zhiqiang,ZOU Haisheng,WANG Yunjie

(Fishery Machinery and Instrument Research Institute,Chinese Academy of Fishery Sciences,Key Laboratory of

Fishery Equipment and Engineering,Ministry of Agriculture and Rural Affairs,Shanghai 200092,China)

Abstract:Ensuring the appropriate dissolved oxygen concentration in the aquaculture water is crucial to the

healthy growth of cultured fish. In order to meet the oxygen demand requirements for high-density aquaculture

with super large water capacity of aquaculture vessel. According to the double membrane theory and Fick’ s

law,as well as the testing standards for the oxygenation capacity of aerators,a speece cone size model was

designed and its oxygen enhancement performance tests were conducted. The experiment results show that the

dissolved oxygen concentration at the outlet of the speece cone reaches 40 mg / L, and the supersaturated

dissolved oxygen is close to 400%,achieving ultra-high saturation dissolved oxygen. Under the conditions of an

oxygen intake rate of 7. 6 m

3

/ h and an oxygen cone operating pressure of 0. 07 -0. 25 MPa,the oxygenation

capacity is not significantly affected by the operating pressure. However, the optimal intake rate range is

significantly affected by the operating pressure. The higher the operating pressure,the less likely it is to form

large bubbles on the water surface when the oxygen intake rate increases,thus maintaining a higher oxygen

utilization rate. When the oxygen intake is greater than 6. 5 m

3

/ h and the operating pressure is between 0. 07

MPa and 0. 25 MPa,each aquaculture cabin is equipped with one speece cone of this structural size to meet

the oxygen demand of the aquaculture cabin. The oxygenation capacity of this speece cone is significantly

higher than other oxygenation devices,and its power efficiency is also higher than most oxygenation devices,

which is suitable for oxygenation of aquaculture vessel. This study provides basic data for the engineering

design and stable and efficient operation of the oxygen enrichment equipment of aquaculture vessel.

Key words:aquaculture vessel;high density aquaculture;speece cone;oxygen increasing ability;operating pressure

55

第58页

第 51 卷第 5 期 渔 业 现 代 化 Vol. 51 No. 5

2024 年 10 月 FISHERY MODERNIZATION Oct. 2024

DOI:10. 3969 / j. issn. 1007-9580. 2024. 05. 007 开放科学(资源服务)标识码(OSID):

徐婵,刘峰,李娴,等. 黄河三角洲盐碱地稻蟹共作系统水质和底栖生物群落[J]. 渔业现代化,2024,51(5):56-62.

收稿日期:2024-01-15

基金项目:山东省重点研发计划(重大科技创新工程)“重要经济鱼类品种创制与绿色养殖关键技术研究与示范(2021CXGC010806)”

作者简介:徐婵(2000—),女,硕士研究生,研究方向:水产生物生态学。 E-mail:XuChan1018@ 163. com

通信作者:刘峰(1983—),男,副研究员,研究方向:水环境生态学。 E-mail:lf007001@ 163. com

黄河三角洲盐碱地稻蟹共作系统水质和底栖生物群落

徐 婵1,2

,刘 峰2

,李 娴2

,董 俊2

,苗 静3

,高云芳2

,董 文2

,闫法军2

(1 上海海洋大学水产与生命学院,上海 200120;

2 山东省淡水渔业研究院,山东 济南 250000;

3 巴彦淖尔市农牧局,内蒙古 巴彦淖尔 014400)

摘要:2020 年 6—10 月,在山东东营垦利区设置 4 个不同河蟹养殖密度(0、0. 45、0. 68、0. 90 ind / m

2

)的稻蟹

共作试验,测定其系统水质和底栖生物群落结构变化,旨在为盐碱地稻蟹共作生态模式构建与优化提供理论

依据。 结果显示:试验期间水体温度(T)、溶氧(DO)、总氮(TN)与总磷(TP)等指标先高后低,受季节变化影

响明显;不同河蟹养殖密度间水体指标均无明显差异(P>0. 05),可能与河蟹养殖密度相对养殖稻田面积明

显较小有关;稻蟹共作系统水质氮磷年平均值含量显著低于水稻单作,高于河蟹池塘单养,但共作系统氮磷

吸收能力相对最高;底栖生物检测仅发现水丝蚓、摇蚊幼虫、圆田螺 3 种,这与黄河三角洲的砂石底质有关,

其生物量与水体盐度呈显著正相关(P<0. 05),与水体 PO

3-

4

-P 呈极显著负相关(P<0. 01)。 研究表明黄河三

角洲改良盐碱地稻蟹共作系统具有明显的生态优势。

关键词:稻蟹共作;水质;底栖生物;盐碱地;黄河三角洲

中图分类号:S966. 16 文献标志码:A 文章编号:1007-9580(2024)05-0056-007

黄河三角洲是典型滨海盐碱地,土壤中过高的

Na

+

、Cl

-含量限制了农业发展[1]

。 据统计,东营市

利用黄河来水改良盐碱地稻田约 2. 35 万 hm

2 [2]

,

但水稻单作模式管理成本高、效益低,产生大量撂

荒地的问题十分突出[3]

。 中华绒螯蟹(Eriocheir

sinensis)俗称河蟹,是中国第二大淡水虾蟹类养殖

品种。 2022 年 全 国 稻 蟹 共 作 面 积 高 达 17 万

hm

2 [4]

,占河蟹养殖总面积的 20. 2%。 稻蟹共作被

证明能有效降低盐碱地耕作层 pH 和盐分,减少养

殖对环境的影响[5]

,具有成本低、效益高的显著优

势。 底栖生物对环境变化极其敏感,常作为水体环

境监测的生物指标,又是河蟹的天然饵料,在维持

稻田生态系统中起重要作用[6]

。 目前稻蟹共作系

统水质研究报道较多[7-9]

,底栖生物研究较少[10]

,

盐碱地稻蟹共作相关报道仅见李楠等[11]对盘锦市

盐碱地稻蟹共作水质的动态变化研究。

开展了黄河三角洲盐碱地稻蟹共作模式水质

和底栖生物群落结构变化研究,旨在为黄河流域盐

碱地稻蟹共作生态效应和模式优化提供参考。

1 材料与方法

1. 1 试验设计

试验地点选在山东省东营市垦利县永安镇二

十八村一邦农业科技有限公司水稻创新创业服务

示范基地(37°31′46″ N,118°46′55″ E,海拔 20. 9

m)。 共设试验稻田 7 个,每个约为 58 m×37 m,

岸边设防逃网,四周挖“回”字型环沟,环沟宽约 2

m、深约 0. 9 m,环沟内移植少量伊乐藻(Elodea)。

试验水稻品种为津原 U99,蟹品种为中华绒螯蟹,

于 5 月下旬栽种与投放,每日下午投喂饲料。 设

置 4 个河蟹养殖密度,分别为 0 ind / m

2

( CK)、

0. 45 ind / m

2

( RE1 )、 0. 68 ind / m

2

( RE2 )、 0. 90

ind / m

2

(RE3),以 DRE 代表稻田水体处理组,分

别为 DRE1、DRE2、DRE3,对照组为 DCK;以 HRE

第59页

第 5 期 徐婵等:黄河三角洲盐碱地稻蟹共作系统水质和底栖生物群落

代表环沟水体处理组,同上。 试验初期养殖水体

各指标均值为:温度( 23. 3 ± 0. 5) ℃ , pH 7. 7 ±

0. 1,溶氧 DO(4. 68±0. 40) mg / L,盐度 S 0. 062±

0. 000,总氮(4. 987±0. 200) mg / L,总磷(2. 103±

0. 400) mg / L。





 



 

 N

图 1 试验稻田及环沟示意图

Fig. 1 Diagram of paddy field and ring ditch

1. 2 采样及分析方法

稻苗插秧(6 月)开始采集每月稻田和环沟水

体及生物样品。 水体样品用有机玻璃采水器采集,

硝酸盐(NO

-

3

-N)、磷酸盐( PO

3-

4

-P)、亚硝酸盐

(NO

-

2

-N)、氨氮(NH

+

4

-N)、总氮(TN)及总磷(TP)

均采用国标法测量,水温(T)、pH、溶氧(DO)和盐

度(S)直接用便携水质分析仪(上海三信 SX825)

现场测定。 底栖生物样品用彼得逊采泥器采集,

过 60 目筛网流水洗出泥样,置于白瓷盘中活体分

拣、现场鉴定。

因稻田排水,8、9、10 月稻田未采集到水质样

品,试验数据用 SPSS27. 0 软件处理。

2 结果与分析

2. 1 稻蟹共作系统水质动态变化

2. 1. 1 常规水质因子

试验期间稻田和环沟间、不同养殖密度间水

质指标含量均无显著性差异(P>0. 05)。 试验期

间稻田 T 变化范围为 22. 4~28. 6 ℃ ,环沟 T 变化

范围为 15. 3 ~ 28. 8 ℃ ,随气温的变化,8—9 月稻

田 T 略高于环沟水体;稻田 DO 变化范围为 4. 56~

6. 20 mg / L,环沟 DO 变化范围为 4. 1 ~ 6. 1 mg / L,

随季节变化 DO 呈先上升后下降的趋势;S 变化

范围为 0. 039 ~ 0. 067;pH 波动范围为 7. 6 ~ 7. 9,

整体呈弱碱性。 各组水体水温和溶氧动态变化如

图 2 所示。

     

 

 B

C







图 2 各组水体水温和溶氧动态变化

Fig. 2 Dynamic changes of water temperature and dissolved oxygen

2. 1. 2 总氮总磷

稻田与环沟间、不同养殖密度间 TN、TP 无显

著性差异(P>0. 05)。 图 3 所示,水体 TN 变化范

围为 4. 731~7. 724 mg / L,稻田水体 TN 平均含量

5. 126 mg / L,环沟 TN 平均含量 5. 121 mg / L;水体

TP 变化范围为 2. 120 ~ 5. 919 mg / L,稻田水体 TP

平均含量 2. 511 mg / L,环沟 TP 平均含量 1. 740

mg / L。 TN、TP 含量变化均呈先上升后迅速下降

的趋势。 共作田 TN 含量较单作田低,而 TP 含量

则相反,但差异均不显著(P>0. 05)。

2. 1. 3 三态氮及磷酸盐

所有指标水体含量在稻田与环沟间、不同养

殖密度间差异均不显著(P>0. 05)。 图 4 所示,水

体 NH

+

4

-N 变化范围为 0. 027~0. 356 mg / L,NH

+

4

-

N 含量下降后上升又下降;水体 PO

3-

4

-P 变化范

围为 0. 015~0. 201 mg / L,稻田水体 PO

3-

4

-P 含量

在 8 月份略高于环沟水体的指标值;水体 NO

-

3

-N

变化范围为 0. 927 ~ 2. 168 mg / L;水体 NO

-

2

-N 变

化范围为 0. 024~0. 197 mg / L,PO

3-

4

-P、NO

-

3

-N 与

NO

-

2

-N 月份平均含量波动大无明显规律。

57

第60页

渔 业 现 代 化 2024 年

 

     

B

C

图 3 各组水体 TN 和 TP 动态变化

Fig. 3 Dynamic changes of total nitrogen and total phosphorus

B

C

  





















  



D

E

































  

 

  

B

C

  





















  



 D

E





















B

C

  





















  



D

E

































  

 

  

图 4 各组水体营养盐动态变化

Fig. 4 Dynamic changes of nutrients

表 1 不同河蟹养殖密度下稻田、环沟水环境因子的比较

Tab. 1 The contrast of water environmental factors in paddy field and ring ditch under different culture density of Mitten crab

处理组指标

RE1

环沟 稻田

RE2

环沟 稻田

RE3

环沟 稻田

CK

环沟 稻田

T/ ℃ 22. 900±5. 120 25. 700±2. 500 23. 200±4. 590 25. 300±2. 620 23. 000±4. 830 25. 400±2. 100 — 25. 500±2. 870

DO/ (mg / L) 4. 960±0. 570 5. 600±0. 570 5. 200±0. 510 5. 100±0. 520 5. 752±0. 570 5. 300±0. 720 — 5. 700±0. 460

S / ‰ 0. 048±0. 010 0. 057±0. 010 0. 049±0. 010 0. 056±0. 010 0. 049±0. 010 0. 052±0. 010 — 0. 058±0. 000

pH 7. 800±0. 070 7. 700±0. 100 7. 700±0. 070 7. 800±0. 150 7. 800±0. 080 7. 700±0. 000 — 7. 700±0. 100

TN/ (mg / L) 5. 144±1. 280 5. 488±1. 780 4. 938±1. 350 4. 559±1. 220 5. 281±1. 460 5. 330±2. 150 — 5. 364±2. 180

TP / (mg / L) 1. 614±1. 150 2. 084±1. 620 1. 952±2. 120 2. 942±2. 790 1. 655±1. 500 2. 506±2. 690 — 1. 280±1. 080

NO

-

3

-N/ (mg / L) 1. 450±0. 420 1. 254±0. 270 1. 780±0. 290 1. 606±0. 310 1. 460±0. 320 1. 595±0. 500 — 1. 558±0. 570

NO

-

2

-N/ (mg / L) 0. 087±0. 100 0. 098±0. 050 0. 082±0. 030 0. 060±0. 020 0. 077±0. 040 0. 104±0. 080 — 0. 054±0. 030

NH

+

4

-N/ (mg / L) 0. 154±0. 070 0. 227±0. 070 0. 207±0. 160 0. 238±0. 080 0. 161±0. 110 0. 236±0. 120 — 0. 323±0. 070

PO

3-

4

-P / (mg / L) 0. 118±0. 070 0. 085±0. 060 0. 103±0. 070 0. 132±0. 070 0. 088±0. 060 0. 072±0. 080 — 0. 074±0. 040

58

第61页

第 5 期 徐婵等:黄河三角洲盐碱地稻蟹共作系统水质和底栖生物群落

2. 2 稻蟹共作系统底栖生物群落结构

养殖周期内共检测到底栖生物 3 种,分别为

水丝蚓( Limnodrilus)、摇蚊幼虫(Chironomid)、圆

田螺(Cipangopaludina)。 不同养殖密度之间底栖

生物平均生物量无显著差异(P>0. 05),水丝蚓平

均生物量显著高于摇蚊幼虫(P<0. 05),稻蟹共作

系统底栖生物以水丝蚓为主。 如图 5 所示,摇蚊

幼虫平均生物量 0. 26 mg / m

2

,水丝蚓平均生物量

为 2. 38 mg / m

2

,圆田螺仅在 RE1 稻田水体中少量

出现,检测数量 12. 8 ind / m

2

,生物量为 0. 94 mg /

m

2

。 试验期间底栖生物的变化趋势为:摇蚊幼虫

平均生物量先上升后下降;水丝蚓平均生物量波

动大无明显趋势。

2. 3 水环境因子与底栖生物群落结构相关性

研究水环境因子与底栖生物的关系,一方面

反映养殖水体生境质量,不同底栖生物种类对水

环境的适应不同,耐污种常在有机质和氮磷元素

丰富的水体中出现和繁殖,敏感种则相反;另一方

面旨在为保护养殖水体底栖生物多样性提供理论

依据。 据表 2,对水体 T、pH、TN 等共 11 个环境

因子与底栖生物量进行 Pearson 相关性分析,结

果表明底栖生物量与 S 呈显著正相关(P<0. 05),

与 PO

3-

4

-P 呈极显著负相关(P<0. 01)。 其余指

标均无显著相关性(P>0. 05)。





       

 





    



图 5 稻田、环沟底栖生物量对比

Fig. 5 Benthic biomass of paddy field and ring ditch

表 2 水环境因子与底栖生物生物量 Pearson 相关性分析

Tab. 2 Pearson correlation analysis between water environmental factors and benthic biomass

生物

指标

相关性

指标

水环境因子

T S DO pH TN TP NO

-

3

-N NO

-

2

-N NH

+

4

-N PO

3-

4

-P CODMn

生物量

相关系数 0. 061 0. 956

∗ -0. 611 -0. 669 0. 072 0. 235 0. 619 -0. 803 0. 082 -0. 992

∗∗ -0. 413

P 值 0. 922 0. 011 0. 274 0. 217 0. 909 0. 704 0. 266 0. 406 0. 896 0. 001 0. 489

注:∗∗表示在 0. 01 级别(双尾)极显著;∗表示在 0. 05 级别(双尾)显著相关

3 讨论

3. 1 河蟹养殖密度对水质因子的影响

试验中不同河蟹养殖密度间水温均无显著差

异(P>0. 05),可见虾蟹类采食等搅动能力相对较

弱,这与其他稻蟹 ( 虾) 共作模式研究结论一

致[9,12]

。 8 月份环沟水温略低于稻田,说明深挖

环沟、增加遮蔽物能解决夏季稻田水温较高、河蟹

不耐高温[13]的问题。

孙文通等[14] 研究稻蟹共作发现养殖密度与

DO 存在显著负相关;王世会等[15]研究寒区稻蟹共

作 DO 变化认为河蟹呼吸耗氧高于扰动溶氧,因此

高密度养蟹田 DO 低于低密度养蟹田。 本试验发

现不同河蟹养殖密度对水体 DO 均无显著影响(P>

0. 05),其原因可能有二:一是高密度养殖河蟹底层

活动和代谢对 DO 有显著影响,本试验河蟹养殖密

度设置较小,最高密度仅为 0. 90 ind / m

2

,远低于孙

文通等[14]

、王世会等[15] 试验河蟹放养的最低密

度(18 ind / m

2

,6. 75 ind / m

2

);二是高密度养殖下

投喂过量高蛋白配合饲料也会增加水体耗氧[8]

张晨[16]研究盘锦市改良盐碱地稻蟹共作发现水

体 S 维持在 0. 75~ 3. 50,本试验中水体 S 最高仅

59

第62页

渔 业 现 代 化 2024 年

为 0. 067,表明试验稻田改良效果较好。 重度盐

碱地改良需要洗盐 2~3 次[3]

,随着盐碱地综合利

用工程的推进,含盐量不断降低已适宜作物生长。

综上所述,黄河三角洲改良盐碱地稻田水体

T、DO、S 等关键水环境因子均能满足水稻与河蟹

生长的需要。

3. 2 稻蟹共作模式氮磷吸收

据报道,稻蟹共作系统为水稻提供了额外养

分[9]

,促使水稻对氮磷的吸收提高了 5. 2% ~

23. 3%

[17]

,其水体氮磷主要受饲料投喂、生物吸

收代谢、施肥及补水换水频率等多因素影响[18]

本试验中水体氮磷含量先升高后降低,八月 TN、

TP 到达峰值,与张云杰等[9]八月氮磷下降的结论

相左。 这是因为本试验七月底稻田排水后引入了

大量富含氮磷的水库水。 但随着气温上升、物理

沉降作用及水稻生长加快,根系吸收作用和微生

物分解净化作用增强,水体氮磷又迅速下降。 苗

静等[19]研究发现河蟹食物源贡献率中人工饵料

仅占 21. 3%,且日常观察中未见明显残饵,说明

本试验较低的饲料投喂量未对水体氮磷含量产生

明显影响。

目前全国水稻单作模式水体 TN、TP 峰值年平

均值变化范围分别为 12. 50 ~ 84. 13 mg / L、0. 48 ~

3. 29 mg / L

[20]

,蟹塘模式水体 TN、TP 年平均值分

别为 1. 368 ~2. 290 mg / L、0. 095 ~0. 287 mg / L

[21-22]

本试验中水体 TN、TP 年平均值分别为 5. 122 mg / L、

2. 029 mg / L,显著低于水稻单作、高于池塘单养

蟹。 水稻单作氮磷施肥量高且损失量大,利用率

明显低于稻蟹共作模式,其内外水环境氮磷较

高[18,23]

。 因此稻蟹共作能有效降低氮磷肥施用

及其流 失, 减 少 氮 磷 污 染。 张 勇[24] 和 周 露 洪

等[25]在 6—10 月的研究中池塘养蟹水体 TN 减量

分别为 0. 027 mg / L、0. 170 mg / L,TP 减量分别为

0. 014 mg / L、0. 101 mg / L,本试验中水体 TN、TP

减量分别为 0. 457 mg / L、1. 831 mg / L,其氮磷吸

收效果较蟹塘更为显著。 由此可见,相较于传统

的水稻单作模式与河蟹单养模式,稻蟹共作模式

氮磷流失少吸收多,外排污染少,具有显著的生态

优势。

3. 3 盐碱地稻蟹共作模式底栖生物群落结构

底质条件是引起底栖生物群落结构差异的因

素之一[26]

。 段学花等[27] 研究发现细沙底质物种

丰度最低,在黄河干流东营河段未采集到底栖生

物。 董贯仓等[28] 发现黄河三角洲河蟹养殖池塘

生物多样性指数最低,3 次采集底栖生物种类均

低于 4 种,1 / 3 频次未采集到样本。 这与本试验

结果一致。 东营市黄河三角洲主要组分是砂,底

质不稳定导致底栖生物生存空间小[29]

,因此底栖

生物种类和生物量相对其他生境显著较低。

试验中不同养殖密度对底栖生物种类无显著

影响。 Koester 等[30]认为自然条件下河蟹对底栖

生物具有显著掠食性影响,李岩等[10] 研究表明稻

蟹共作系统底栖生物种类数与河蟹养殖密度呈负

相关。 但苗静等[19]研究发现系统河蟹食物源中,

贡献率最大的水生植物占 57. 1%,底栖生物仅占

11. 96%,可见稻蟹共作模式下,由于食物源充足,

低密度河蟹养殖对底栖生物的摄食较弱。

3. 4 水环境因子与底栖生物群落结构相关性

相关性结果显示影响稻田底栖生物量的水环

境因子有二:一是水体 PO

3-

4

-P 与底栖生物量呈

极显著负相关(P<0. 01),二是水体盐度与底栖生

物量呈显著正相关(P<0. 05),可见在本试验条件

和盐度范围内,低 PO

3-

4

-P 的环境更适宜底栖生

物的生存。 但姜苹红等[31] 在汉阳湖底栖生物的

研究中发现颤蚓类和摇蚊幼虫分布与 PO

3-

4

-P 含

量呈正相关,赵文等[32] 发现盐度高( >0. 5)且变

化大的盐碱地养鱼池塘水体中,底栖生物种类

和生物量较少,两者呈负相关,与试验结果均不

同,可能是黄河三角洲低盐盐碱地改良稻田的

生境相对较为特殊,导致其对营养盐的响应不

同。 稻田系统水体相对河流、湖泊规模非常小,

人工干预活动影响相对剧烈,其水环境因子、底

栖生物波动较河流和湖泊等自然环境变化复

杂。 但目前尚未找到稻田单作、稻蟹共作水体

中 PO

3-

4

-P、盐度对底栖生物影响的相关报道,且

与水环境因子相比,黄河三角洲盐碱地的特殊

底质对底栖生物的影响更为明显,其底栖生物

群落结构单一,种类数和生物量相对较少,试验

结论与其他生境相比有所不同。

4 结论

黄河三角洲稻蟹共作系统水环境 T、DO 及 S

等均能满足水稻与河蟹生长,且河蟹低密度养殖

60

第63页

第 5 期 徐婵等:黄河三角洲盐碱地稻蟹共作系统水质和底栖生物群落

对稻田水环境无显著影响,其水体氮磷吸收相比

水稻单作、池塘养蟹模式具有明显优势;共作系统

底栖生物种类、密度和生物量较低,以耐低氧的水

丝蚓为主,低密度河蟹养殖对底栖生物群落结构

无显著影响。 综上所述,黄河三角洲改良盐碱地

稻蟹共作系统具有明显的生态优势。 □

参考文献

[1] 贾壮壮,谭亚男,管孝艳,等. 宁夏盐碱地成因及分区治理措

施综述[J]. 灌溉排水学报,2023,42(5):122-134.

[2] 山东省统计局. 山东省统计年鉴 2021[M]. 北京:中国统计

出版社,2021:205-206.

[3] 董晓亮,侯红燕,郭涛,等. 黄河三角洲重度盐碱地稻蟹生态

种养模式研究及效益分析[J]. 山东农业科学,2020,52(7):

123-127.

[4] 于秀娟,郝向举,党子乔,等. 中国稻渔综合种养产业发展报

告(2023)[J]. 中国水产,2023(8):19-26.

[5] 杨树军,蒋晖. 甘肃省景泰县盐碱地渔业发展情况探析[ J].

中国水产,2020(2):59-61.

[6] 戴纪翠,倪晋仁. 底栖动物在水生生态系统健康评价中的作

用分析[J]. 生态环境,2008,17(5):2107-2111.

[7] 吕东锋,王武,马旭洲,等. 稻田生态养蟹的水质变化与水稻

生长关系的研究[J]. 江苏农业科学,2010(4):233-235.

[8] 王昂,王武,马旭洲,等. 养蟹稻田水环境部分因子变化研究

[J]. 湖北农业科学,2011,50(17):3514-3519.

[9] 张云杰,王昂,马旭洲,等. 稻蟹共作模式稻田水质水平变化

初步研究[J]. 广东农业科学,2013,40(14):16-19.

[10]李岩,王武,马旭洲,等. 稻蟹共作对稻田水体底栖动物多样

性的影响[J]. 中国生态农业学报,2013,21(7):838-843.

[11]李楠,桑海旭,马晓慧,等. 滨海稻区稻蟹共作对水田生态的

影响[J]. 西南农业学报,2019,32(10):2432-2437.

[12]肖家程,谭庆东,梁正其,等. 贵州喀斯特山区稻虾共作模式

对稻田水质昼夜变化的初步研究[ J]. 水产科技情报,2022,

49(1):24-29.

[13] 王武. 河蟹的生物学 [ J]. 水产科技情报, 2007 ( 1 ): 25-

28,50.

[14]孙文通,张庆阳,马旭洲,等. 不同河蟹放养密度对养蟹稻田

水环境及水稻产量影响的研究[ J]. 上海海洋大学学报,

2014,23(3):366-373.

[15]王世会,赵志刚,罗亮,等. 放养密度对寒区稻-扣蟹共作模式

中河蟹生长及水质的影响[ J]. 水产学杂志,2023,36( 2):

100-108.

[16]张晨. 稻蟹种养中投喂不同蛋白水平河蟹饵料对稻田生态

系统的影响[D]. 大连:大连海洋大学,2016.

[17]BENYAMIN KA M B Q. Optimal rice- crab co- culture system as

a new paradigm to air-water-food nexus sustainability [ J ].

Journal of Cleaner Production,2021,291:125936.

[18]吕明睿,高子健,张欣雨,等. 不同稻蟹共作模式下的氮磷平

衡及生态经济效益研究[ J]. 华中农业大学学报,2023,42

(1):108-117.

[19]苗静,刘峰,闫法军,等. 基于稳定同位素的黄河三角洲盐碱

地稻蟹种养系统中华绒螯蟹食物源分析[ J]. 应用生态学

报,2022,33(6):1489-1496.

[20]张子璐,刘峰,侯庭钰. 我国稻田氮磷流失现状及影响因素

研究进展[J]. 应用生态学报,2019,30(10):3292-3302.

[21]兰艳,俞锦辰,刘怡琳,等. 河蟹池塘生态养殖对水环境的影

响[J]. 水产科技情报,2021,48(3):166-172.

[22]刘金金,张玉平,孙振中. 上海崇明中华绒螯蟹养殖池塘水环境

质量及氮磷负荷估算[J]. 淡水渔业,2020,50(6):60-69.

[23]李卫华,范平,黄东风,等. 稻田氮磷面源污染现状、损失途

径及其防治措施研究[ J]. 江西农业学报, 2011, 23 ( 8):

118-123.

[24]张勇. 施肥对中华绒螯蟹幼蟹池塘水质及浮游生物的影响

[D]. 上海:上海海洋大学,2019.

[25]周露洪,谷孝鸿,曾庆飞,等. 江苏省固城湖围垦区池塘河蟹

生态养殖效益及污染输出分析[J]. 湖泊科学,2013,25(3):

406-413.

[26]王银东,熊邦喜,杨学芬. 武汉市南湖大型底栖动物的群落

结构[J]. 湖泊科学,2005,17(4):327-333.

[27]段学花,王兆印,程东升. 典型河床底质组成中底栖动物群

落及多样性[J]. 生态学报,2007,27(4):1664-1672.

[28]董贯仓,李秀启,高云芳,等. 黄河三角洲湿地水域底栖动物

群落结构及其时空差异[ J]. 海洋环境科学,2012,31( 2):

229-232.

[29]胥维坤,陈沈良,李平,等. 黄河三角洲近岸沉积物和悬沙的

分布特征及其冲淤指示[J]. 泥沙研究,2016(3):24-30.

[ 30]KOESTER M,FRENZEL C,BECKER G,et al. Food Spectrum of

the chinese mitten crab ( Eriocheir sinensis): Insights from the

Lower River Rhine comparing stable isotope mixing models and

genetic gut content analyses [ J]. Aquatic Invasions, 2022, 17

(4):560-576.

[31]姜苹红,崔永德,王海军,等. 汉阳湖群底栖动物群落及其对

环境质量的指示[ J]. 长江流域资源与环境,2011,20( 5):

525-533.

[32] 赵文,董双林,张美昭,等. 盐碱池塘底栖动物的初步研究

[J]. 应用与环境生物学报,2001(3):239-243.

61

第64页

渔 业 现 代 化 2024 年

Study on the dynamic changes of water quality and benthic community

of rice- crab co- cropping model in saline- alkali land of Yellow River Delta

XU Chan

1,2

,LIU Feng

2

,LI Xian

2

,DONG Jun

2

,MIAO Jing

3

,DONG Wen

2

,YAN Fajun

2

(1 College of Fisheries and Life Sciences,Shanghai Ocean University,Shanghai 200120,China;

2 Shandong freshwater Fisheries Research Institute,Jinan 250000 ,Shandong,China;

3 Bayannaoer Agriculture and Animal Husbandry Bureau,Bayan nur 014400 ,Inner Mongolia,China)

Abstract:Setting 4 different culture densities of Eriocheir sinensis(0,0. 45,0. 68,0. 90 ind / m

2

) in Dongying,

and the changes of water and benthic community were studied. It provides theoretical basis for the construction

and optimization of rice- crab co- cropping model in saline- alkali land. The results showed as follows:During

the experiment,water temperature ( T),dissolved oxygen (DO),total nitrogen ( TN) and total phosphorus

(TP) were firstly high and then low, which were obviously affected by seasonal changes. There was no

significant difference in water indexes among different densities of Eriocheir sinensis(P>0. 05),which may be

related to the obvious small culture density compared with the cultivated paddy area. The average annual water

nitrogen and phosphorus content of rice and crab co- cropping system was significantly lower than that of rice

single cropping system. And it is significantly higher than the single culture of aquaculture pond. The nitrogen

and phosphorus absorption capacity of the co- cropping system was the highest in these three aquaculture

models. Three species of benthic were detected during the experiment,which were Limnodrilus,Chironomid and

Cipangopaludina. The main reason is that the sandy sediment of the Yellow River Delta is not suitable for their

survival. The biomass was positively correlated with water salinity (P<0. 05) and negatively correlated with

water PO

3-

4

-P (P<0. 01). In conclusion, rice- crab co- cropping in the improved saline- alkali land has obvious

ecological effects.

Key words:rice and crab co- cropping; water quality; benthos; saline- alkali land; Yellow River Delta

62

第65页

第 51 卷第 5 期 渔 业 现 代 化 Vol. 51 No. 5

2024 年 10 月 FISHERY MODERNIZATION Oct. 2024

DOI:10. 3969 / j. issn. 1007-9580. 2024. 05. 008 开放科学(资源服务)标识码(OSID):

黄宏涛,袁红春. 基于轻量级非线性无激活网络的水下图像增强[J]. 渔业现代化,2024,51(5):63-71.

收稿日期:2024-05-01

基金项目:国家自然科学基金“基于海洋大数据深度学习的渔情预测模型研究(41776142)”

作者简介:黄宏涛(1999—),男,硕士研究生,研究方向:人工智能应用。 E-mail:3044349929@ qq. com

通信作者:袁红春(1971—),男,教授,研究方向:人工智能应用。 E-mail:hcyuan@ shou. edu. cn

基于轻量级非线性无激活网络的水下图像增强

黄宏涛,袁红春

(上海海洋大学信息学院,上海 201306)

摘要:为解决水下图像常见的色彩偏差和低对比度等问题,提出了一种基于轻量级非线性无激活网络的水下

图像增强方法。 该方法的核心主要由多个非线性无激活模块级联构成,摒弃传统激活函数,旨在实现更高效

的信息传递和特征提取。 此外,集成的层注意力机制能够识别并利用跨层特征间的依赖性,动态分配特征权

重,强化关键特征。 试验结果显示,在 LSUI(Large Scale Underwater Image)数据集上,该模型与 FUnIE-GAN

及 Shallow-UWnet 相比,在 SSIM 指标上分别实现了 8. 17%和 4. 13%的提升,使得增强后的图像在颜色准确

性、细节保留等方面取得显著改善;同时,模型的参数量分别降低 98%和 50%,显著提高了在设备性能受限

环境下应用的可行性。 研究表明,该方法不仅有效校正了水下图像的色彩偏差等问题,其轻量级特性还极为

适合部署于低配硬件上,为水下成像技术的实际应用提供支撑。

关键词:水下图像增强;深度学习;图像处理;色彩校正

中图分类号:S 969. 39;TP 391. 4 文献标志码:A 文章编号:1007-9580(2024)05-0063-009

当前,随着渔业领域对水下环境的深入研究,

水下图像质量直接影响渔业资源评估、捕捞规划

和渔场管理的有效性和准确性。 然而,由于水下

环境复杂,实际获取的图像常存在退化问题,如对

比度不足、细节模糊和颜色失真,严重影响对渔业

资源[1-2]的准确观察和分析。 采用图像增强技术

能有效改善这些问题,提升图像清晰度和可视性,

有助于准确识别和分析水下环境中的生物和物理

特征,如鱼群分布、栖息地状况和水质变化。

传统的图像增强方法,如 Retinex 算法[3]

、水

下暗通道先验(UDCP)

[4]

、限制对比度自适应直

方图均衡化(CLAHE)

[5]等,虽然可以处理一些简

单的水下场景,如浅水区,但对于复杂的场景,如

低光照或模糊的场景,效果较差。 为了应对这些

挑战,近年来,研究人员开始探索使用基于深度学

习模型进行图像增强。 这些模型可以捕捉到图像

中的不同变化,从而更好地应对复杂的水下场景。

李庆忠等[6] 提出了一种改进的循环一致性生成

对抗网络(CycleGAN),实现了水下图像颜色校正

与增强,保留边缘结构信息,并通过两阶段学习策

略优化模型性能。 Fu 等[7] 提出了一种基于跨空

间和通道维度的水下图像增强网络,能够减少每

个小批次实例中跨空间维度的激活相关性,实现

模型性能的提升。 胡海峰等[8] 提出了一种双注

意力融合生成对抗网络的水下图像增强模型,该

模型通过结合 Pix2Pix 网络、双注意力机制、改进

型 Non-local 模块和 Transformer 模块,大幅提升

了水下图像增强的效果和性能。 Wang 等[9] 提出

了一种基于生成对抗网络(GAN)的模型,该模型

添加了注意力机制以增强水下图像。 结果显示,

大部分水下图像对比度和清晰度得到显著提升。

刘玉珍等[10] 提出一种基于多尺度特征融合

注意力网络的水下图像增强方法,通过多特征提

取和特征调制模块,有效增强水下图像的视觉质

量。 Lu 等[11]提出了一种基于去噪扩散概率模型

的实时水下图像增强方法,在扩散阶段将退化图

像与参考图像相结合来构建模型。 Mu 等[12] 提出

了一种自适应传输和动态颜色引导的水下图像增

第66页

渔 业 现 代 化 2024 年

强网络,设计了一个自适应定向传输模块来更好

地引导网络。 为了解决颜色偏差问题,还设计了

一个动态颜色引导模块来对增强后的图像颜色进

行后处理。 Zhou 等[13]提出了一种多色空间引导的

颜色估计模块,该模块通过将来自两个颜色空间的

特征合并到同一网络中来准确地估计颜色信息。

然而,上述方法大多倾向于采用深度更深及结构更

为复杂的网络模型来追求性能的边际增长,这一策

略不可避免地导致了庞大的参数量与极高的浮点

运算需求。 这不仅大幅增加了模型的存储开销,也

对计算资源提出了严峻挑战,尤其是在那些计算能

力或内存容量相对有限的设备上[14-15]

针对上述问题,提出了一种基于轻量级非线

性 无 激 活 网 络 ( Non - linear Activation Free

Network,NAFNet) 的图像增强方法。 该方法在

NAF 模块[16]的基础上构建了 3 个 NAFGroup,旨

在更有效地捕捉水下图像的特征,进而改善增强

效果;此外,还引入了一个层注意力模块( Layer

Attention Module,LAM),该模块通过学习不同深

度特征间的关联性,动态地强调各层的特征,优化

了对图像中上下文信息的提取。

1 算法

1. 1 网络总体架构

研究了一种基于轻量级非线性无激活网络的

水下 图 像 增 强 框 架, 包 括 非 线 性 无 激 活 组

(NAFGroup ) 和 层 注 意 力 模 块 ( LAM )。 每 个

NAFGroup 由 3 个 NAF 模块组成,这些 NAF 模块

在提取图像特征的同时显著降低了计算复杂度。

LAM 模块通过融合来自不同层的信息,进一步丰

富了特征的细节表达。 图 1 展示了整体网络

架构。

3BX *NBHF

$POW #MPDL /\"' (SPVQ -\".

&OIBODF *NBHF

图 1 网络总体架构

Fig. 1 Overall network architecture

图像处理流程从预处理卷积层开始,此层负

责初步提取图像特征并传递至 NAFGroup。 模型

包括 3 个串联的 NAFGroup,每个 NAFGroup 提取

出来的特征分为两部分,其中一部分传递给下一

个 NAFGroup,以深化特征表达和优化性能,另外

一部分输出特征则被输入到 LAM 模块,进行堆

叠、重塑、转置和特征融合操作,捕捉图像的全局

上下文信息。 此阶段的核心在于综合各阶段提取

的特征,实现对图像内容的全面融合。 最终处理

的特征通过两个 3×3 卷积层进一步处理,以减少

通道数并增强特征表达。 最后,通过恒等映射[17]

将处理后的特征与原始输入图像融合,输出增强

后图像。

1. 2 非线性无激活组

NAF 模块规避了 ReLU

[18]

、Leaky ReLU

[19] 等

常规激活函数,旨在简化模型的计算复杂性。 该

策略通过执行纯粹的线性变换,确保了输入数据

的原始特征被保留,从而减轻计算负担并有效减

少模型参数,提高了模型运行的效率。

为了最大化 NAF 模块的功能并提升网络在

捕获图 像 上 下 文 信 息 的 敏 感 度, 设 计 了 一 个

NAFGroup,其中多个 NAF 模块被级联组合。 NAF

模块级联可以逐步扩展网络对图像的感知范围,

将局 部 特 征 逐 步 整 合 成 全 局 特 征。 而 在

NAFGroup 末端的 3×3 卷积层可以在这个过程中

进一步整合局部空间信息,促进全局上下文的融

合,从而提高网络对图像整体结构和语义的理解

能力。 这种配置使得网络能够构建更深层次的特

征提取机制,逐步细化图像特征,增强了网络的非

线性表达和特征提取能力。 NAF 模块和 NAF 组

结构如图 2 所示。

64

第67页

第 5 期 黄宏涛等:基于轻量级非线性无激活网络的水下图像增强

/\"' #MPDL

/\"' #MPDL

/\"' #MPDL

f $POW f$POW

f$POW

f$POW

f$POW

f %FPOW

4JNQMF(BUF

4JNQMF(BUF

4$\"

-BZFS/PSN

-BZFS/PSN

图 2 NAF 模块和 NAF 组的结构

Fig. 2 Architecture of NAF block and NAF group

在 NAF 模块中,输入首先通过层归一化,以

帮助稳定训练过程。 接下来是卷积操作和简单门

(Simple Gate,SG)。 SG 是门控线性单元(Gated

Linear Units,GLU)

[20]的改进,如公式(1)所示。

SG(X,Y)= X·Y (1)

式中:X 代表输入特征向量的按照通道维度拆分

后的前半部分;Y 则代表后半部分。

因为 GLU 是一个基于门控机制的非线性激

活函数,且 SG 和 GLU 激活函数之间有相似性,所

以 SG 可以近似看作是 GLU 激活函数的替代。

SG 通过逐元素相乘方式,使得特征图能够在保留

大部分原始信息的同时,更好地挖掘和整合不同

通道的特征表示,有助于提高模型对复杂图像特

征的理解能力。 具体结构如图 3 所示。

8

)

8

)

8

$ )

$

$

图 3 简单门模块

Fig. 3 Simple gate module

NAF 模块中引入了另一个模块,即简化通道

注意力(Simplified Channel Attention,SCA)。 虽然

SCA 模块去掉了通道注意力中的激活函数,但是没

有降低模型的总体性能。 SCA 模块通过将图像的

上下文信息与各个通道的特征深度融合,这一过程

不仅增强了模型在复杂场景中捕捉细微特征与关

键信息的能力,还显著提升了模型在深层次理解图

像内容时的精确度。 其结构如图 4 所示。

1PPMJOH

f$POW

图 4 简化通道注意力模块

Fig. 4 Simplified channel attention module

1. 3 层注意力模块

常见的密集连接[21] 与跳跃连接机制促使浅

层特征直接流向深层,但这些策略并未充分挖掘

不同层间潜在的相互依存关系。 通过学习各层特

征间的关联关系,网络能够为各层特征赋予适当

的注意力权重,可以使模块更加关注重要的特征,

从而自动增强特征的表达力。 因此,设计了一种

层注意力模块(LAM),旨在自动捕捉不同层级特

征的内在联系,进而显著增强模型性能和特征的

表达能力,具体如图 5 所示。

在 LAM 中,首先对每个 NAF 组输出特征进

行堆叠,然后每个特征图首先被重塑为二维矩阵,

尺寸为 K×HWC,其中 K、H、W 和 C 分别是特征图

的 NAF 组数、高度、宽度和通道数。 通过将其与

转置矩阵相乘来找到这个二维矩阵的相关矩阵。

随后,将二维矩阵与此关联矩阵相乘,并将其重塑

为 K×H×W×C 张量。 接着与原始输入进行特征

融合。 然后将结果特征重塑为 H×W×KC,最后通

过 1×1 卷积操作得到 H×W×C 特征图。

65

第68页

渔 业 现 代 化 2024 年

,f)f8f$

,f)8$

5SBOTQPTF

3FTIBQF

3FTIBQF

3FTIBQF

f$POW

4PGUNBY

)f8f,$ )f8f$

图 5 层注意力模块

Fig. 5 Layer attention module

1. 4 损失函数

为了进一步优化模型的训练,本模型添加了

3 种损失函数,即边缘损失 LEDGE 、均方误差损失

LMSE 和快速傅里叶变换损失 LFFT 函数。 这 3 个损

失函数的线性结合,可以更好地捕捉图像的多方

面特性,加速网络的收敛,从而提高模型的性能,

损失函数 L 公式(2)如下。

L = LEDGE

+ λ1 LMSE

+ λ2 LFFT (2)

式中:λ1 和 λ2 为比例因子,根据经验分别设置为

0. 01 和 0. 04。

边缘损失:在增强图像质量的过程中有助于

保持或增强图像中的边缘细节,如保留轮廓和纹

理信息等,公式(3)如下。

LEDGE

= ▽2

(x) - ▽2

(y)

2 + ε

2

(3)

式中:▽2 代表拉普拉斯算子;x 代表输出的增强

图像;y 代表对应的参考图像;ε 代表一个常量,使

公式在零点可导。

均方误差损失:通过最小化增强后图像与参

考图像之间的差异,来优化模型参数,以生成更高

质量的图像,公式(4)如下。

LMSE

=

1

N∑

N

i = 1

(yi

- xi)

2

(4)

式中:N 代表每次批处理的样本数量。

快速傅里叶变换损失:通过将图像转换到频

域,在频域计算增强图像和参考图像之间的 L1 距

离,可以恢复丢失的高频细节,减少频域空间中的

差异,使图像更加清晰,公式(5)如下。

LFFT

=

1

N∑

N

i = 1

( FFT(xi) - FFT(yi) 1 ) (5)

式中:FFT 表示进行快速傅里叶计算。

2 结果与讨论

2. 1 试验设置

本试 验 基 于 Ubuntu 操 作 系 统, GPU 采 用

NVIDIA GeForce RTX3090。 为了提高训练效率,把

所有训练集和测试集图像大小全部调整为 256×

256,并将批处理的大小固定为 2。 在模型训练过

程中,学习率为 0. 000 1,并进行了 110 轮的训练。

为了优化模型的性能,采用了 Adam

[22]优化器。 在

模型设计方面,本研究采用了 1×1 和 3×3 两种不同

尺寸的卷积核。 采用了 3 个 NAF 组,每个组有 3

个 NAF 块,且均不使用激活函数。 这种设计可以

有效地提高模型的效率,并降低过拟合的风险。

2. 2 数据集

众所周知,水下图像的参考图像很难获得。

为了提高模型的性能和泛化能力,需要一个大规

模且多样化的数据集。 本研究所用的数据集为大

规模水下图像 ( Large - Scale Underwater Image,

LSUI)

[23]

,与 UIEB

[24]相比,LSUI 数据集包含更多

的图像和更丰富的内容,总共包含 4 279 对水下

图像及其相应的参考图像。 此外,LSUI 包含多种

水下场景、物体类别、深海洞穴图像,这使得数据

集更加丰富和多样化。 本研究训练集使用了

LSUI 的 4 200 对图像。 为了更好地评估模型的性

能,采用了两个测试集。 测试集 A 使用 LSUI 剩

余的 79 个配对图像,测试集 B 采用水下拍摄设备

从学校池塘中拍摄的 50 张图片。

2. 3 对比试验

2. 3. 1 测试集 A 的对比试验

为了评估本研究提出的算法的有效性,分别

将该算法与 CLAHE、 ICM、UDCP、 FUnIE - GAN、

Shallow-UWnet

[25-27]进行了对比分析。 图 6 展示

了不同方法在测试集 A 上的图像增强结果。 从

图 6 中可以看出,CLAHE 方法虽然有效地提高了

图像的亮度,但由于过曝问题的存在,使图像的细

节受到了严重影响。 ICM 和 UDCP 方法增强后图

像的呈现明显偏暗,进一步降低了图像的恢复效

果。 FUnIE-GAN 方法有效地消除了原始图像中

66

第69页

第 5 期 黄宏涛等:基于轻量级非线性无激活网络的水下图像增强

的大部分蓝绿色调, 但是仍有残留。 同样地,

Shallow-UWnet 方法虽然大部分情况下能保持与

参考图像的相似度,但是偶尔也会产生轻微的红

色色偏和无法有效校正蓝色色偏的问题。 相比之

下,本研究提出的方法在保留细节、提高亮度和对

比度方面表现出色,有效地丰富了图像内容。 同

时能够校正颜色偏差,使得生成的图像更接近于

真实场景的颜色,减少了与参考图像之间的差异,

这证明了本研究方法在颜色校正方面具有更高的

竞争力。

*OQVU $-\")& *$. 6%$1 '6O*&(\"/ 68OFU 0VST (5

图 6 不同算法在测试集 A 的定性对比

Fig. 6 Qualitative comparison of different algorithms on test set A

不同算法在测试集 A 上的对比结果如表 1

所示。

表 1 不同算法在测试集 A 上的对比结果

Tab. 1 Comparison of results for different algorithms on test set A

方法 SSIM PSNR LPIPS

CLAHE 0. 751 18. 037 0. 332

ICM 0. 819 20. 869 0. 287

UDCP 0. 556 13. 995 0. 384

FUnIE-GAN 0. 783 24. 058 0. 158

Shallow-UWnet 0. 812 22. 857 0. 302

Ours 0. 847 25. 809 0. 135

在本研究中,采用了 3 种全参考的图像评价

指标[28-29]来进行测试集 A 的定量分析,包括峰值

信噪比(PSNR)、结构相似性指数(SSIM)、学习感

知图像块相似度(LPIPS)。 PSNR 和 SSIM 是衡量

图像质量的两个重要指标。 PSNR 反映了增强后

图像与参考图像的接近程度,其中 PSNR 值反映

了与图像内容的接近程度,SSIM 值反映了结构和

纹理的相似程度。 LPIPS 是一种基于深度神经网

络的图像质量度量,它将人类视觉系统对图像和

参考图像的感知进行比较,并提供反映视觉相似

性程度的分数。 较低的 LPIPS 得分意味着更好。

表 1 可以看出,该模型在 3 个指标上均超越了对

比算法。 这一结果证明了所提出算法在增强图像

细节和清晰度方面的有效性,及增强后图像更加

符合人类的视觉感知。

2. 3. 2 测试集 B 的对比试验

图 7 展示了不同方法在无参考测试集 B 上

的增强结果。 观察可知,CLAHE 方法未能完全消

除原始图像中的红色色偏,并在鱼的周围引入了

蓝色背景,导致增强后的图像在视觉感知上较差。

ICM 方法虽然成功消除了红色色偏,但整体图像

呈现出过度的蓝色色偏,因此其增强效果不理想。

UDCP 方法所产生的视觉效果相对较暗,在亮度、

细节保真度和色彩平衡方面仍有提升的空间。

FUnIE-GAN 和 Shallow-UWnet 两种方法的增强

后图像明显偏向红色,在很大程度上削弱了图像

的增强效果。 相比之下,本研究提出的方法在大

部分测试图像上展现出了良好效果,尤其是在图

像细节保留和颜色校正方面,能够在最大限度地

67

第70页

渔 业 现 代 化 2024 年

保留图像细节的同时,提升图像的视觉美感,更贴

近图像所在的水下环境[30-31]

,从而获得更为自然

的视觉效果,这有力地证明了本研究所提方法拥

有良好的增强效果。

*OQVU $-\")& *$. 6%$1 '6O*&(\"/ 4IBMMPX68OFU 0VST

图 7 不同算法在测试集 B 的定性对比

Fig. 7 Qualitative comparison of different algorithms on test set B

为了进一步评估模型的性能,在测试集 B 上

采用 了 3 种 无 参 考 的 水 下 图 像 质 量 度 量 方

法[32-34]

。 水下彩色图像质量评估(UCIQE) 是一

种评估图像的视觉质量的方法。 水下图像质量度

量(UIQM)结合了水下图像的特点和人类视觉系

统的感知来评估水下图像的质量。 自然图像质量

(NIQE)用于评估图像的自然度和清晰度,值越小

代表效果越好。 通过表 2 可以看出,本研究提出

的算法在 UIQM 指标上略低于 FUnIE-GAN,其余

指标均优于对比算法,这表明所提算法在改善图

像的颜色准确性和清晰度[35] 等方面也具有良好

的效果。

表 2 不同算法在测试集 B 上的对比结果

Tab. 2 Comparison of results for different algorithms on test set B

方法 UCIQE UIQM NIQE

CLAHE 0. 499 2. 440 7. 487

ICM 0. 498 2. 468 7. 691

UDCP 0. 530 2. 332 7. 479

FUnIE-GAN 0. 499 2. 828 7. 864

Shallow-UWnet 0. 485 2. 217 9. 039

Ours 0. 573 2. 745 7. 224

为了进一步评估模型的复杂度,分别在浮点

运算数(FLOPs) 和参数量( Parameters) 和其他算

法上进行对比,具体如表 3 所示。 可以明显观察

出,本研究所提出的算法在参数量及浮点运算数

两项关键指标上均达到了最低水平,这一优势显

著降低了计算资源的需求,提升了模型在计算受

限环境下的适用性,使其在实际部署中更具灵活

性与广泛性。

表 3 模型的浮点运算数和参数量对比

Tab. 3 Deep learning methods compared in terms of

FLOPs and Parameters

方法 FLOPs / G Parameters / K

FUnIE-GAN 7. 84 7 020

Shallow-UWnet 21. 67 219

Ours 6. 65 110

2. 4 消融试验

为了准确评估 NAF 模块和 LAM 模块对模型

性能的影响,在测试集 A 上进行了相应的消融试

验。 试验设计 4 种配置:不含 NAF 模块(使用普

通激活函数)、不含 LAM 模块、不含 LAM 和 NAF

模块和包含全部模块的完整模型。

68

第71页

第 5 期 黄宏涛等:基于轻量级非线性无激活网络的水下图像增强

定量结果展示在表 4 中。 结果表明,组合

NAF 模块和 LAM 模块的配置在 PSNR 和 SSIM 等

关键性能指标上明显优于其他配置,显示出最佳

的图像增强效果,这反映了两者之间的互补性。

表 4 LAM 模块和 NAF 模块的消融试验数据

Tab. 4 Ablation experimental data of the LAM module and

NAF module

方法 SSIM PSNR LPIPS

不含 LAM 0. 757 18. 579 0. 352

不含 NAF 0. 752 19. 607 0. 311

不含 LAM 和 NAF 0. 722 16. 798 0. 564

完整模型 0. 847 25. 809 0. 135

图 8 直观展示了不同配置下的消融试验对

比。 发现在缺少 LAM 模块的情况下,图像呈现轻

微的粉红色调偏差;缺少 NAF 模块时,图像则倾

向于绿色调;当 LAM 与 NAF 模块同时缺失时,图

像色调偏向粉绿色,与参考图像差异显著;只有同

时配备 NAF 与 LAM 模块,恢复的图像才能最大

程度地接近参考图像,实现准确的色彩还原及显

著提升的亮度和对比度,从而使视觉效果更加真

实生动。

综合上述两种结果,NAF 模块与 LAM 模块

的结合显著提升了性能,更关键的是,它们在多个

维度上全面提高了图像质量,从而实现了最优的

增强效果。

*OQVU -\". /\"' -\"./\"' 

 (5

图 8 消融试验对比图

Fig. 8 Comparison chart of ablation test

3 结论

针对水下图像常见的色彩偏差和低对比度等

问题,提出了一种端到端的轻量级水下图像增强

模型。 通过多个 NAF 块集成,不仅降低了模型复

杂性,还有效提取了深层特征。 并且进一步引入

了 LAM 注意力机制,增强了不同层次特征之间的

交互,显著提升了模型性能。 经过定量和定性分

析,本研究所提模型在多个性能指标上超越了对

比的图像增强模型,不仅使得增强后的图像更接

近于参考图像,而且在细节表现上更为丰富,更贴

合人类视觉感知。 此外,该模型的存储占用仅为

0. 11 MB,便于在性能受限的水下探测设备上部

署。 未来,本研究将继续优化模型性能,并探索其

在更广泛应用场景中的潜力,以应对水下图像恢

复领域的挑战。 □

参考文献

[1] 陈新军,刘金立,林东明,等. 渔业资源学研究发展现状及趋

势[J]. 上海海洋大学学报,2022,31(5):1168-1179.

[2] 董梦如,郭建科,郑苗壮,等. 公海渔业资源对中国的潜在战

略价值评估—基于太平洋典型渔区的比较分析[ J]. 自然资

源学报,2023,38(11):2757-2772.

[3] FU X, ZHUANG P, HUANG Y, et al. A retinex - based

enhancing approach for single underwater image [ C] / / Paris:

IEEE International Conference on Image Processing ( ICIP ),

69

第72页

渔 业 现 代 化 2024 年

2014:4572-4576.

[4] DREWS P,NASCIMENTO E,MORAES F, et al. Transmission

estimation in underwater single images [ C ] / / Sydney: IEEE

International Conference on Computer Vision ( ICCV )

Workshops,2013:825-830.

[5] PISANO E D,ZONG S,HEMMINGER B M,et al. Contrast limited

adaptive histogram equalization image processing to improve the

detection of simulated spiculations in dense mammograms [ J ].

Journal of Digital imaging,1998,11:193-200.

[6] 李庆忠,白文秀,牛炯. 基于改进 CycleGAN 的水下图像颜色

校正与增强[J]. 自动化学报,2023,49(4):820-829.

[7] FU Z,LIN X,WANG W,et al. Underwater image enhancement

via learning water type desensitized representations [ C ] / /

Singapore:IEEE International Conference on Acoustics, Speech

and Signal Processing (ICASSP),IEEE,2022:2764-2768.

[8] 胡海峰,李凤英.一种双注意力融合生成对抗网络的水下图

像增强模型[ J]. 桂林电子科技大学学报, 2023, 43 ( 5):

371-380.

[9] WANG Y,FAN H,LIU S,et al. BA-GAN:Block attention GAN

model for underwater image enhancement [ C] / / Beijing: IEEE

International Conference on Unmanned Systems ( ICUS),2021:

809-813.

[10]刘玉珍,刘美怡,林森,等. 多尺度特征融合注意力网络的水

下图像增强[ J]. 计算机辅助设计与图形学学报,2023,35

(5):685-695.

[11]LU S,GUAN F,ZHANG H,et al. Speed-Up DDPM for realtime underwater image enhancement[ J]. IEEE Transactions on

Circuits and Systems for Video Technology, 2024, 5 ( 34 ):

3756-3588.

[12]MU P,FANG J,QIAN H,et al. Transmission and color-guided

network for underwater image enhancement [ C ] / / Brisbane:

IEEE International Conference on Multimedia and Expo

(ICME),2023:1337-1342.

[13]ZHOU J C,LI B S,ZHANG D H,et al. UGIF-Net:An efficient

fully guided information flow network for underwater image

enhancement[J]. IEEE Transactions on Geoscience and Remote

Sensing,2023,61:1-17.

[14]焦丽娜. 影响计算机数据处理运算速度的因素及解决对策

分析[J]. 软件,2022,43(11):156-158.

[15]马春燕,陈晶,姚鼎,等. 嵌入式智能计算机计算能力评测方

法[J]. 计算机学报,2023,46(11):2279-2301.

[16]CHEN L,CHU X,ZHANG X,et al. Simple baselines for image

restoration [ C] / / Tel Aviv: European conference on computer

vision. Cham:Springer Nature Switzerland,2022:17-33.

[17]杨壮,吴斌,廉炜雯,等. 基于注意力机制和深度恒等映射的

人脸识别[J]. 传感器与微系统,2020,39(9):150-153.

[18]ECKLE K, SCHMIDT - HIEBER J. A comparison of deep

networks with ReLU activation function and linear spline-type

methods[J]. Neural Networks,2019,110:232-242.

[19]LIU Y,WANG X,WANG L,et al. A modified leaky ReLU scheme

(MLRS) for topology optimization with multiple materials [ J].

Applied Mathematics and Computation,2019,352:188-204.

[20]DAUPHIN Y N,FAN A,AULI M,et al. Language modeling with

gated convolutional networks [ C ] / / Ningbo: International

conference on machine learning,PMLR,2017:933-941.

[21]夏旻,宋稳柱,施必成,等. 基于加权密集连接卷积网络的深

度强化学习方法[J]. 计算机应用,2018,38(8):2141-2147.

[22] ZHANG Z. Improved adam optimizer for deep neural networks

[C] / / Banff:2018 IEEE/ ACM 26th international symposium on

quality of service (IWQoS),IEEE,2018:1-2.

[23]PENG L,ZHU C,BIAN L. U-shape transformer for underwater

image enhancement [ J ]. IEEE Transactions on Image

Processing,2023,32:3066-3079.

[24] LI C Y, GUO C L, REN W Q, et al. An underwater image

enhancement benchmark dataset and beyond [ J ]. IEEE

Transactions on Image Processing,2020,29:4376-4389.

[25] IQBAI K, SALAM R, OSMAN A N, et al. Underwater image

enhancement using an integrated colour model [ J ]. Iaeng

International Journal of Computer Science, 2007, 34 ( 2 ): 239

-244.

[26]ISLAM M J,XIA Y,SATTAR J. Fast underwater image enhancement

for improved visual perception[J]. IEEE Robot Autom Lett,2020,5

(2):3227-3234.

[27]NAIK A,SWARNAKAR A,MITTAL K. Shallow-uwnet:Compressed

model for underwater image enhancement [ J]. Proceedings of the

AAAI Conference on Artificial Intelligence,2021,35 (18):15853

-15854.

[28]ALAIN H,ZIOU D. Image quality metrics:PSNR vs. SSIM[C] / /

Istanbul:20th international conference on pattern recognition,IEEE,

2010:2366-2369.

[29] ZHANG R, ISOLA P, EFROS A A, et al. The unreasonable

effectiveness of deep features as a perceptual metric[ C] / / Salt

Lake City: Proceedings of the IEEE conference on computer

vision and pattern recognition,2018:586-595.

[30]郑博伟,李宗辉,陈锐彬,等. 基于离散小波变换的细节增强

的图像修复优化方法[ J]. 信息技术与信息化,2024( 6):46

-51.

[31]金伟其,刘斌,范永杰,等. 红外图像细节增强技术研究进展

[J]. 红外与激光工程,2011,40(12):2521-2527.

[32] PANETTA K, GAO C, AGAIAN S. Human - visual - system -

inspired underwater image quality measures[J]. IEEE Journal of

Oceanic Engineering,2015,41(3):541-551.

[33]YANG M, SOWMYA A. An underwater color image quality

evaluation metric[J]. IEEE Transactions on Image Processing,2015,

24(12):6062-6071.

[34]MITTAL A, SOUNDARARAJAN R, BOVIK A C. Making a

“ completely blind ” image quality analyzer [ J]. IEEE Signal

processing letters,2012,20(3):209-212.

[35]段哲一,李天冉,李守业,等.一种基于 FPGA 的图像清晰度

算法研究[J]. 集成电路与嵌入式系统,2024,24(4):51-56.

70

第73页

第 5 期 黄宏涛等:基于轻量级非线性无激活网络的水下图像增强

Underwater image enhancement based on lightweight

non-linear activation free network

HUANG Hongtao,YUAN Hongchun

(College of Information Technology,Shanghai Ocean University,Shanghai 201306,China)

Abstract:To overcome the common issues of color distortion and low contrast in underwater image processing,

this study developed an innovative underwater image enhancement technique based on a lightweight non-linear

activation free network. The core feature of this technique is the use of multiple cascaded non-linear activation

free modules without traditional activation functions,significantly enhancing the flow of information and the

efficiency of feature extraction. Additionally, the model integrates an innovative layer attention mechanism,

which effectively identifies and optimizes feature dependencies between different layers, enhancing the

expression of key information through dynamic adjustment of feature weights. To comprehensively evaluate the

performance of the proposed method, detailed experiments were conducted on the Large Scale Underwater

Image (LSUI) dataset. Compared with leading models such as FUnIE-GAN and Shallow-UWnet,our model

demonstrated a significant advantage in structural similarity index (SSIM),with improvements of 8. 17% and

4. 13% respectively,markedly enhancing the color accuracy and detail retention of the images. Furthermore,the

parameter count of our model was significantly reduced, decreasing by 98% and 50% respectively, greatly

enhancing the model′s practicality and deployment capabilities in environments with limited computational

resources. The results of this study confirm the effectiveness of this enhancement technique in addressing key

visual challenges in underwater imaging and also demonstrate its potential for application in extreme visual

environments. By introducing this lightweight and efficient image enhancement approach,new pathways have

been opened for the further development and innovation of underwater image processing technologies,laying a

solid foundation for the widespread deployment of underwater vision systems in practical applications.

Key words:underwater image enhancement; deep learning; image processing; color correction

71

第74页

第 51 卷第 5 期 渔 业 现 代 化 Vol. 51 No. 5

2024 年 10 月 FISHERY MODERNIZATION Oct. 2024

DOI:10. 3969 / j. issn. 1007-9580. 2024. 05. 009 开放科学(资源服务)标识码(OSID):

耿春新,王爱民,阎天宇,等. 基于改进 YOLOv8n 损失函数的克氏原螯虾体特征识别算法[J]. 渔业现代化,2024,51(5):72-80.

收稿日期:2024-03-12

基金项目:江苏现代农业产业技术体系建设专项资金项目(JATS[2023]471));国家重点研发计划项目(2023YFD2402000);盐城渔业高

质量发展项目(2022yc003)

作者简介:耿春新(2001—),女,硕士研究生,研究方向:系统与自动控制。 E-mail:19551538307@ 163. com

通信作者:王爱民 (1975—) ,男,教授,研究方向:水产动物营养与饲料科学。 E-mail:blueseawam@ ycit. cn

基于改进 YOLOv8n 损失函数的克氏原螯虾体特征识别算法

耿春新1

,王爱民1,2

,阎天宇1

,郁傲男2

,张昊轩2

,张武肖2

,

阳 程3

,刘兴国4

,朱 浩4

,顾夕章5

,李进峰6

,邵 鹏7

(1 盐城工学院信息工程学院,江苏 盐城 224051;

2 盐城工学院海洋与生物工程学院,江苏 盐城 224051;

3 盐城工学院优集学院,江苏 盐城 224051;

4 中国水产科学研究院渔业机械仪器研究所,上海 200092;

5 射阳六和饲料有限公司,江苏 射阳 224300;

6 江苏进峰农业科技有限公司,江苏 建湖 224700;

7 盐城市上水环境生物科技工程有限公司,江苏 盐城 224051)

摘要:克氏原螯虾(Procambarus clarkii)产业发展迅速,然而仍面临智能化水平偏低的问题,在养殖及加工过

程中主要通过人工肉眼观察克氏原螯虾规格及完整性并作出相关判断。 为解决克氏原螯虾的智能识别问

题,提出基于 YOLOv8n 识别克氏原螯虾的虾体、虾尾及螯足的算法。 通过将原有损失函数 CIoU 替换为

MPDIoU,并引入尺度因子 ratio 控制辅助边框的尺度大小用于计算损失,与 MPDIoU 损失函数相结合,提高边

界框回归的准确性和效率,实现对克氏原螯虾虾体、虾尾及螯足的精准识别,为研究其分级智能化提供思路。

结果显示,在 YOLOv8n 模型中加入 Inner-MPDIoU 的算法训练结果相比原有的 CIoU 损失函数识别率有所提

高,mAP 从 83. 7%提高到了 90. 8%。 研究表明,该算法模型有助于对克氏原螯虾的主要部位实现精准识别,

对研究克氏原螯虾的智能化精准分级具有推动作用。

关键词:克氏原螯虾;图像识别;YOLOv8;MPDIoU; 深度学习

中图分类号:TP391;S951. 2 文献标志码:A 文章编号:1007-9580(2024)05-0072-009

近年来,克氏原螯虾(Procambarus clarkii)养

殖规模和产值再创新高,养殖面积达到 18. 67 万

hm

2

、产量 289. 07 万 t,同比分别增长 7. 69% 和

9. 67%

[1]

。 不同市场对克氏原螯虾的规格需求不

同[2]

,目前克氏原螯虾商品虾的规格分拣主要通

过人工挑选,依赖工人积累的经验对克氏原螯虾

的完整性、活力及规格进行判断后进行划分。 该

过程存在工人个体的主观性与差异性,划分结果

具有较大的误差,且人工划分时间较长,克氏原螯

虾活力有所下降,导致虾应激死亡率高,造成较大

的经济效益损失。

随着深度学习的不断发展,目标检测在水产

养殖行业为精准养殖、鱼类行为监测、数量统计及

水产品病害识别等提供技术支持。 Jiang 等[3] 利

用迁移学习和层间融合机制,用于识别 10 种具有

复杂背景的鱼类。 试验结果表明,该模型能够提

高复杂水下场景下的鱼类分类识别能力,可为渔

业资源分布研究提供支持。 在深度学习模型中,

YOLO(You Only Look Once)系列属于端到端的网

络,因具有检测速度快的特点而被广泛使用[4]

许竞翔等[5] 利用添加注意力机制、特征融合及

K-means++聚类算法提升 YOLOv5 对小目标细菌

的检测精度,解决了人工计数鱼病原细菌效率低、

误差 大 等 问 题。 Li 等[6] 在 基 于 YOLOv5 引 用

第75页

第 5 期 耿春新等:基于改进 YOLOv8n 损失函数的克氏原螯虾体特征识别算法

Res2Net 残差结构及坐标注意力机制代替原有的

Bottleneck,实现了在渔业中准确、快速的鱼类检

测方法。 袁红春等[7] 基于 DP -YOLO 模型,结合

动态检测门算法避免对金枪鱼重复计数,提出的

错计误差指标评估技术方法使渔获量自动计数精

度达到 97. 9%,为远洋渔业渔获量自动统计提供

了新思路。 YOLOv8 是 YOLO 系列的最新算法,

相较该系列其他算法在检测精度上有所提升[8]

涂万等[9]提出养殖鱼群检测方法 YOLOv8-HeadECAM,在 FPN 中增大尺寸检测头,便于更好地捕

捉水下鱼类个体的细节信息,利用 ECAM 注意力

机制减少模糊背景的干扰,能够更好地适应水下

鱼群模糊、遮挡的情况。 袁红春等[10]为解决传统

商业渔船监控鱼类检测与识别任务人工成本高、

工作量大等问题,基于 YOLOv8 模型改进主干网

络 GCBlock 结 构, 增 加 特 征 提 取 能 力, 使 用

GSConv 新型卷积方式减少模型计算量,将损失函

数 CIoU 替换为 SIoU,以更低的成本实现商业渔

船电子监控数据中鱼类的检测与识别。

克氏原螯虾相比其他水产养殖生物规模化养

殖发展较晚,针对其智能化研究较少,结合以上深

度学习对其他生物的应用研究,将其引入克氏原

螯虾产业中,实现对克氏原螯虾商品虾的虾体、螯

足及尾部的识别,推动克氏原螯虾相关产业智能

化发展。 对克氏原螯虾各部位进行标注时,发现

边框重叠度较高,影响检测结果的精度,为尽可能

减少该影响,提出将 Inner-IoU 与 MPDIoU 结合代

替原有 CIoU 的方法,提高边界框回归的准确性和

效率,在一定程度上获得了更好的检测精度。

1 材料与方法

1. 1 试验环境配置与数据准备

1. 1. 1 环境部署

本研究的总体流程图如图 1 所示。 使用官网

克隆 的 YOLOv8n 模 型, 在 PyCharm 平 台 利 用

GPU 进行训练,GPU 型号为 NVIDIA GTX3060,

CUDA 版本 12. 1,Python 版本 3. 11,CPU 为 R5-

5600,操作系统为 Windows11 专业版。

1. 1. 2 数据准备

本研究以克氏原螯虾为试验对象,为方便该

研究成果在实际工业场景中应用,所用数据集图

像均采用单一白色背景,以增强图像处理的一致

性和模型的泛化能力。 数据集图像是使用安卓手

机内置相机在实验室环境中实地拍摄获得。 克氏

原螯虾为市场购入不同规格的商品虾。 由于样本

数量有限,对数据进行了图像增强处理,以扩充数

据集提高模型训练的充分性以及模型的泛化能

力。 具体方法包括对原始图像(图 2a)进行镜像

翻转(图 2b)、灰度化处理(图 2c)以及增加噪点

(图 2d)等多种增强操作。

fl



fl

fl

ffifl



ffi







44%

:0-W

:0-W

图 1 克氏原螯虾识别流程图

Fig. 1 Flowchart for the identification of crayfish

D E

B C

图 2 数据集图像扩增

Fig. 2 Dataset image augmentation

采用 Labelimg 标注工具[11] 对克氏原螯虾图

像进行精准标注,将其主要划分为 3 个部位:虾体

(Crayfish)、螯足(Aofoot)及尾部(Tail),并对每个

部位进行单独标注,标注完成后按照 YOLO 数据

73

第76页

渔 业 现 代 化 2024 年

格式的要求保存为文本文件(txt 格式),标注过程

如图 3 所示。

图 3 数据集标注

Fig. 3 Dataset annotation

将处理完成的数据集共 1 073 张图片按 9 ∶1

的比例划分为训练集与验证集,同生成的标签文

件共同放入 YOLOv8 项目进行训练,设置试验迭

代次数为 200 次。

1. 2 基于改进 YOLOv8n 的克氏原螯虾识别方法

1. 2. 1 YOLOv8n 改进

YOLOv8 提供一种全新的 SOTA 模型,集合了

YOLO 系列函数的优点并作出部分改进[12]

。 包

括 5 种 模 型, 分 别 是 YOLOv8n、 YOLOv8s、

YOLOv8m、YOLOv8l 及 YOLOv8x,其中 YOLOv8n

是最轻量化的模型,主要分为 Input、Backbone、

Neck 和 Head 4 个 部 分[13]

。 本 研 究 将 在

YOLOv8n 基础上进行改进。

损失函数是计算预测值(P)与真实值(G)差

距的函数,损失值越小证明模型越成功[14]

。 计算

如公式(1)所示:

LIoU

=

P ∩ G

P ∪ G

(1)

Inner-IoU 通过辅助边框计算 IoU 损失,并引

入尺度因子针对不同的数据集与检测器控制辅助

边框的尺度大小计算损失,弥补现有 IoU-based

边框回归损失泛性化不足的问题[15]

。 Inner-IoU

定义公式(2) ~ (8)所示:

b

g

l

= x

g

c

-

w

g·r

2

,b

g

r

= x

g

c

+

w

g·r

2

(2)

b

g

t

= y

g

c

-

h

g·r

2

,b

g

b

= y

g

c

+

h

g·r

2

(3)

bl

= xc

-

w·r

2

,br

= xc

+

w·r

2

(4)

bt

= yc

-

h·r

2

,bb

= yc

+

h·r

2

(5)

i = [min(b

g

r ,br) - max(b

g

t ,bt)]·[min(b

g

b,

bb) - max(b

g

t ,bt)] (6)

u = (w

g·h

g

)·r

2 + (w·h)·r

2 - i (7)

L

I

IoU

=

i

u

(8)

式中:g 表示真实边界框(Ground Truth);( x

g

c ,y

g

c )

表示真实边界框与真实边界框内部的中心点;

(xc,yc)表示锚框与内部锚框的中心点;x、y、w、h

分别代表边界框的中心坐标和宽度、高度;r 表示

尺度因子 ratio,通常取值范围是[ 0. 5, 1. 5]; l

(Localization)表示定位损失;c(Confidence) 表示

模型对物体类别预测的准确性;t(Threshold)表示

ratio 因子的阈值;i 表示 inter 交集,指的是预测边

界框 b 和真实边界框 b

g 重叠的区域;u 表示预测

边界框和真实边界框的总面积,包括它们的交集

和非重叠区域;I(inner)表示使用辅助边框( inner

box) 来 计 算 IoU 损 失; IoU 表 示 交 集 比

(Intersection over Union),是预测边界框与真实边

界框重叠区域与它们并集的比值。

Inner-IoU 保留了 IoU 的特性,取值范围为

[0,1],与 IoU 损失相比,当比值<1 且辅助边界盒

尺寸小于实际边界盒时,回归的有效范围小于

IoU 损失,但梯度绝对值大于 IoU 损失得到的梯

度,可以加速高 IoU 样本的收敛。 相反,当比值>

1 时,更大规模的辅助边界框扩大回归的有效范

围,增强低 IoU 样本回归的效果。

YOLOv8 在 Loss 计算方面采用 Task Aligned

Assigner 正 样 本 分 配 策 略, 并 引 入 Distribution

Focal Loss,类别损失采用交叉熵损失,边框回归

采用 DFL Loss+CIoU Loss

[16]

。 边界框回归损失主

要考 虑 重 叠 面 积 ( Overlap area)、 中 心 点 距 离

(Central point distance) 和高宽比(Aspect ratio) 3

个重要几何因素[17]

,CIoU

[18] 包含以上 3 种因素,

计算公式(9) ~ (11)如下:

LCIoU

= LIoU

-

ρ(bg ,bp)

c

2

- αV (9)

V =

4

π

2

arctan

w

g

h

g

- arctan

w

p

h

( p )

2

(10)

α =

V

1 - LIoU

+ V

(11)

式中:ρ 表示两个边界框中心点之间的欧氏距离;

74

第77页

第 5 期 耿春新等:基于改进 YOLOv8n 损失函数的克氏原螯虾体特征识别算法

p 表示预测边界框;c 是一个尺度因子,用于调整

中心点距离项的影响;V 表示宽高比一致性用于

衡量预测边界框与真实边界框的宽高比之间的差

异;α 是一个正的权衡参数,用于平衡宽高比一致

性项 V 的影响。

当预测边界框和真实边界框具有相同宽高

比,但宽度和高度值不同时,大多数现有损失函数

将失 去 有 效 性, 限 制 收 敛 速 度 和 精 度。 而

MPDIoU 损失函数通过最小化预测边界框和真实

边界框之间左上和右下点距离,简化两个边界框

之间的相似性比较,可以适应重叠或非重叠的边

界框回归[19]

。 MPDIoU 计算公式(12)如下:

LMPDIoU

= LIoU

-

d

2

1

w

2 + h

2

-

d

2

2

w

2 + h

2

(12)

式中:d1 、d2 分别是预测边界框的左上角点到真

实边界框左上角点与右下角点的欧氏距离的平

方;w、h 分别表示真实边界框宽度与高度。

1. 2. 2 评价指标

模型训练准确度与精度一般通过 mAP(mean

Average Precision) 值判断[20-22]

。 mAP0. 5 指 在

50%IoU 阈值下的 mAP 值;计算 mAP 0. 5 时,会

在 0. 5 到 0. 95 的 IoU 范围内,以 0. 05 为步评估

模型性能,取这些不同 IoU 阈值下的 mAP 值的平

均,以此来得到一个综合评价指标,简称为 mAP。

精确率(Precision)指正确样本在全部预测样本中

所占比例;召回率(Recall) 反映的是正确分类占

总样本的比例。 本研究模型将通过 Precision、

Recall、mAP 作为试验的评价指标[23]

2 结果与讨论

2. 1 消融试验

为验证 Inner-MPDIoU 对 YOLOv8n 算法改进

的有效性,在数据集上进行多次试验并设计消融

试验,选择精确率( P)、召回率(R) 与 mAP 作为

性能评价指标[24]

。 消融试验[25] 以原始 YOLOv8n

算法为基础模型,依次引入 Inner-IoU、MPDIoU。

消融试验结果如表 1 所示。

表 1 消融试验

Tab. 1 Ablation experiment

模型

精确率

(P)

召回率

(R)

平均精度

(mAP)

YOLOv8n 98. 1% 97. 5% 83. 7%

YOLOv8n+Inner-IoU 98. 9% 99. 5% 89. 5%

YOLOv8n+Inner-MPDIoU 99. 3% 99. 7% 90. 8%

由表 1 可知,在 YOLOv8n 模型中引入 InnerIoU 算法后,其原本已经较高的精确率和召回率

分别进一步增强了 0. 7%和 2%。 此外,平均精度

(mAP)显著提升了 5. 8%。 这表明 Inner-IoU 算

法对于提升模型性能具有显著的正面影响。

在模型中引入 MPDIoU 损失函数时,模型的

性能得到了更进一步的优化。 与原始模型相比,

改进后的模型在 P、R 和 mAP 这三个关键指标上

分别实现了 1. 2%、2. 2%和 7. 1%的增长。 这一结

果充分证实了 Inner-MPDIoU 模块的有效性,以

及通过引入 ratio 因子来控制辅助边框尺寸的策

略,可以显著提升边界框回归的准确性和整体模

型的效率。

综上所述,Inner-MPDIoU 模块的引入,结合

ratio 因子的辅助,不仅增强了模型对边界框回归

任务的处理能力,而且提高了模型对于研究对象

的识别精度。 这种改进对于目标检测任务来说至

关重要,尤其是在需要高精度识别的复杂场景中,

这一方法能够更好地满足研究和应用的需求。

2. 2 模型对比试验

目标检测经典算法包含 YOLO、 SSD 算 法

等[26]

, YOLOv5 是 YOLO 系 列 的 经 典 算 法 之

一[27]

。 为验证 Inner-MPDIoU 在克氏原螯虾各部

位 识 别 的 有 效 性, 将 YOLOv8n 与 SSD 及

YOLOv5s 算法模型进行对比试验,各模型使用的

数据集图片与标签完全一致,即 SSD 使用的 XML

标签文件由 YOLOv5 及 YOLOv8 所使用的 TXT 标

签文件格式转化获得。

SSD 模型对克氏原螯虾进行训练识别结果图

如图 4 所示。

图 4 SSD 检测效果

Fig. 4 SSD detection effect diagram

75

第78页

渔 业 现 代 化 2024 年

由图 4 可知,SSD 模型在识别克氏原螯虾的

虾体方面表现出色,准确度达到了极高的水平。

然而,对于螯足和虾尾的识别,SSD 模型的表现并

不尽如人意。 具体来说,模型在识别螯足和虾尾

时的精度较低,且存在一定程度的漏检问题,这可

能对精确评估和自动化处理造成不利影响。

由图 5 发现 SSD 模型在识别克氏原螯虾尾

部方面的平均精度仅为 47%,这一结果远低于模

型对虾体的识别精度。 此外,模型的整体平均精

度为 76%,虽然这一指标在某些应用场景下可能

已经足够,但对于需要更高识别精度的场合,如精

细化水产加工或高准确度的水产养殖监测,当前

的模型性能显然还有待提升。

$SBZGJTI \"P GPPU 5BJM







N\"1ff















44%







图 5 SSD 平均精度值

Fig. 5 SSD Average Precision

除了识别精度的问题,SSD 模型的训练过程

也较为耗时。 根据模型训练结果知,模型的训练

时长达到了 4. 612 h。 在快速迭代和需要即时反

馈的应用场景中,这一训练时间可能会成为限制

模型应用的瓶颈。 尽管 SSD 模型在某些识别任

务上表现出色,但在对克氏原螯虾的螯足和虾尾

的识别上,仍需进一步优化和改进。

在整体识别性能上达到了较高的水平,表明

该模型在处理此类目标检测任务时具有较强的适

用性和有效性。

然 而 对 于 尾 部 受 损 的 克 氏 原 螯 虾 个 体,

YOLOv5s 模型的识别精度却出现了显著下降。

表明模型对于克氏原螯虾尾部的完整性具有较高

的依赖性,任何损伤或不完整都可能对识别结果

产生负面影响。 因此,对于尾部损伤的个体,可能

需要额外的算法优化或数据增强策略来提升模型

的鲁棒性。

YOLOv5s 模型对克氏原螯虾进行训练识别

结果图如图 6 所示。

图 6 YOLOv5s 检测效果

Fig. 6 YOLOv5s detection effect diagram

此外,YOLOv5s 模型的训练总时长为 5. 564

h,相较于其他评估模型,耗时最长。 当前的训练

速率可能无法满足在线水产监测或自动化分拣系

统等应用场景对效率的高要求。

本研究改进的 YOLOv8 模型训练结果如图 7

所示。

图 7 YOLOv8_Inner_MPDIou 检测效果

Fig. 7 YOLOv8_Inner_MPDIou detection effect diagram

相较于 YOLOv5s 模型,在识别精度上展现出

了相似的高水平表现,但本研究所用模型对各部

位的识别精度均衡性方面表现更佳,即在目标对

象尾部残缺的情况下,改进的 YOLOv8 模型识别

精度依然高于 YOLOv5s 模型,且其训练过程显著

提速,仅耗时 2. 043 h,不足 YOLOv5s 模型训练时

76

第79页

第 5 期 耿春新等:基于改进 YOLOv8n 损失函数的克氏原螯虾体特征识别算法

长的 50%,这种显著的时间缩短,使得 YOLOv8 在

实时检测场景中更具优势,能够更快地适应动态

变化的环境,从而更有效地满足快速迭代和即时

反馈的需求。

图 8 为以上 3 种模型的 mAP 值曲线图,两种

YOLO 模型较 SSD 模型识别精度均接近 1,优于

SSD 模型。 YOLOv5s 与改进的 YOLOv8 模型两者

识别精度相差较小,而后者学习速度更快,训练性

能相对更优秀。

44%

:0-0W

:0-0W

    













N

\"

1

&QPDI

图 8 不同模型的 mAP 值

Fig. 8 Different models value of mAP

图 9 为 YOLOv5s 与改进 YOLOv8 模型在 mAP

的曲线图,改进 YOLOv8 模型在 mAP 范围内精度

稍高于 YOLOv5s。 这种精度上的微小但一致的提

高,使得在克氏原螯虾虾体特征实际检测过程中表

现出了更高的可靠性和更低的误检率。

    













N

\"

1

&QPDI



ffi

:0-0WT

:0-0W*OOFS.1%*P6

图 9 YOLOv5s 与改进 YOLOv8 的 mAP 值

Fig. 9 mAP of YOLOv5s and improved YOLOv8

2. 3 Inner-MPDIoU 识别结果

为验证 Inner-MPDIoU 对克氏原螯虾各部位

识别的性能,识别结果与归一化混淆矩阵如表 2

与图 10 所示。

表 2 Inner-MPDIoU 克氏原螯虾各部位识别结果

Tab. 2 Inner-MPDIoU crayfish parts Identification results

克氏原螯虾部位名称 P R mAP

Crayfish 99. 3% 100% 97. 0%

Aofoot 99. 6% 99. 6% 91. 9%

Tail 99. 0% 99. 5% 83. 5%

Tail

Aofoot

Crayfish

Tail Aofoot Crayfish

图 10 克氏原螯虾部位识别归一化混淆矩阵

Fig. 10 Crayfish parts identification results normalized

confusion matrix

由表 2 可知,克氏原螯虾的各部位的准确率

和召回率均达到了 99%以上,特别是“Aofoot” 的

召回率达到了 1;“Crayfish” 占据面积最大,易于

识 别, mAP 达 到 了 97%, 识 别 效 果 最 好;

“Grayfish ” 特 征 明 显, mAP 也 达 到 了 91. 9%;

“Tail”受克氏原螯虾运动或姿态影响,尾部常呈

蜷曲姿态,被身体遮挡,识别效果较差,mAP 仅达

到了 83. 5%,模型整体精确率达到了 90. 8%。 由

图 10 归一化混淆矩阵可知,从左上角到右下角的

对角线表示每个分类的识别准确率,对角线外区

域表示错误分类区域[28]

,各部位分类精确率均达

到 99%,证明模型的稳定性好。

模型的训练损失曲线图直观反映了模型在训

练中的学习动态,判断模型是否收敛以及是否存

在过拟合问题的重要依据。 改进后的 YOLOv8 模

型训练损失曲线由图 11 可知,可以看出训练损失

与验证损失两者之间相差很小,模型训练效果较

好,具有良好的泛化能力。 损失曲线的平滑下降

趋势进一步地印证了模型训练过程的稳定性。

在目标检测领域,不同种类的水生动物因其

77

第80页

渔 业 现 代 化 2024 年

独特的生理结构和行为习性,给识别任务带来了

不同 程 度 的 挑 战。 相 比 于 南 美 白 对 虾 的 识

别[29-30]

,本研究中克氏原螯虾的识别任务面临更

为复杂的挑战。 克氏原螯虾的螯足体积较大,这

导致在图像中预选框之间的重叠部分增多,进而

增加了边界框回归的难度。 重叠的边界框不仅使

得模型难以区分,还可能引起边界框回归率和准

确度的显著下降,这对模型的识别性能构成了

考验。

5SBJO

7BM

    

&QPDI

-PTT

图 11 克氏原螯虾训练损失

Fig. 11 Crayfish parts loss

针对该问题,本研究引入了 Inner -IoU 损失

函数,这一改进显著提升了边界框尺度大小的计

算精度。 通过 Inner -IoU 损失函数,模型能够更

精确地计算出辅助边框的尺度,从而在损失计算

中更有效地指导边界框的回归。 此外,研究中还

采用了 MPDIoU 损失函数,该函数专门设计来降

低因边框重叠而导致的识别性能下降问题。 通过

这些改进,YOLOv8 模型在处理克氏原螯虾的识

别任务时,展现出了更加出色的效果。 模型不仅

在边界框回归的准确性上有所提高,而且在面对

重叠边框的复杂情况时,依然能够保持较高的识

别准确度。 这些技术的融合显著增强了 YOLOv8

对克氏原螯虾的识别效果,为水产养殖、生物监测

以及其他相关领域的自动化和智能化提供了有力

的技术支持。

3 结论

本研究提出了一种改进的 YOLOv8n 模型,该

模型通过引用 Inner-MPDIoU 损失函数替代传统

的 CIoU 损失函数,显著减少了克氏原螯虾在目标

检测中因边界框重叠所引起的识别精度下降问

题,有效提升了模型的识别准确度。 本研究成果

为克氏原螯虾的智能化识别技术提供了新的技术

支撑,对推动该产业的智能化、自动化升级具有重

要意义。 通过精确的目标检测,可以极大提高克

氏原螯虾养殖、分类,甚至疾病监测等环节的效率

和准确性。 然而,本试验是在受控的实验室环境

中进行的,可能无法完全模拟克氏原螯虾在自然

环境中的复杂行为。 鉴于克氏原螯虾在自然环境

中的高活动性和姿态多样性,这种动态特性在实

际应用场景中可能导致其在固定角度和单一机位

的拍摄条件下只能捕获到它们的部分特征。 这种

局限性增加了对克氏原螯虾进行全面识别的难

度。 因此,未来的研究需要进一步探索更为先进

的算法和策略,以更好地适应克氏原螯虾动态特

性的识别需求。 可能包括但不限于多角度和多机

位的数据采集、时间序列分析,以及深度学习模型

的进一步优化。 通过这些努力,可以在未来实现

对克氏原螯虾更加精准和全面地识别。 □

参考文献

[1] 汪兰,吴伟伦,石柳,等. 两种豆科绿肥对克氏原鳌虾生长及

虾肉品质的影响[ J]. 广东海洋大学学报,2023,43( 6):56

-61.

[2] 张涛,喻亚丽,甘金华,等. 江汉平原克氏原螯虾分级现状、存

在问题与对策[ J]. 中国渔业质量与标准,2021,11( 3):40

-47.

[3] JIANG L W, QUAN H Y, XIE T, et al. Fish recognition in

complex underwater scenes based on targeted sample transfer

learning[J]. Multimedia Tools and Applications,2022,81(18):

25303-25317.

[4] 王金鹏,周佳良,张跃跃,等. 基于优选 YOLOv7 模型的采摘

机器人多姿态火龙果检测系统[ J]. 农业工程学报,2023,39

(8):276-283.

[5] 许竞翔,欧阳建,邱懿,等. 基于改进 YOLOv5 的水产养殖细

菌性鱼病病原细菌检测算法[J]. 渔业现代化,2022,49(2):

60-67.

[6] LI L,GUO S S,TAO J. Fish detection method based on improved

YOLOv5[J]. Aquaculture International,2023,31(5):2513-2530.

[7] 袁红春,史经伟. 基于改进 YOLOv7- tiny 和动态检测门的金

枪鱼自动检测与计数研究[ J]. 渔业现代化,2023,50(6):74

-83.

[8] 马超伟,张浩,马新明,等. 基于改进 YOLOv8 的轻量化小麦

病害检测方法[J]. 农业工程学报,2024,40(5):187-195.

78

第81页

第 5 期 耿春新等:基于改进 YOLOv8n 损失函数的克氏原螯虾体特征识别算法

[9] 涂万,于红,张鹏,等. 基于通道非降维与空间协调注意力的

改进 YOLOv8 养殖鱼群检测[ J]. 大连海洋大学学报,2023,

38(4):717-725.

[10]袁红春,陶磊. 基于改进的 Yolov8 商业渔船电子监控数据中

鱼类的检测与识别[ J]. 大连海洋大学学报,2023,38( 3):

533-542.

[11]王景鑫,潘欣.一种基于 Labelimg 的辅助标注方法[ J]. 科技

创新与应用,2023,13(29):145-148.

[12]李茂,肖洋轶,宗望远,等. 基于改进 YOLOv8 模型的轻量化

板栗果实识别方法[ J]. 农业工程学报,2024,40 ( 1):201

-209.

[13]熊恩杰,张荣芬,刘宇红,等. 面向交通标志的 Ghost-YOLOv8

检测算法[J]. 计算机工程与应用,2023,59(20):200-207.

[14]张晋宁. 基于机器视觉的红富士苹果分级技术及系统实现

研究[D]. 太原:山西农业大学,2020.

[15]田鹏,毛力. 改进 YOLOv8 的道路交通标志目标检测算法

[J]. 计算机工程与应用,2024,60(8):202-212.

[16]ZHENG Z,WANG P,LIU W,et al. Distance-IoU loss:faster and

better learning for bounding box regression[C] / / Proceedings of

the AAAI Conference on Artificial Intelligence. NewYork:AAAI

Press,2020:12993-13000.

[17] ZHENG Z H, WANG P, LIU W, et al. Enhancing geometric

factors in model learning and inference for object detection and

instance segmentation [ J]. IEEE transactions on cybernetics,

2021,52(8):8574-8586.

[18] XUE J L, CHENG F, LI Y Q, et al. Detection of farmland

obstacles based on an improved YOLOv5s algorithm by using

CIoU and anchor box scale clustering [ J]. Sensors, 2022, 22

(5):1790-1790.

[19]张瑶,陈姚节. 改进 YOLOv8 的水面小目标检测算法[ J]. 计

算机系统应用,2024,33(4):152-161.

[20]MAO R,ZHANG Y C,WANG Z X,et al. DAE-Mask:a novel

deep-learning-based automatic detection model for in-field wheat

diseases[J]. Precision Agriculture,2023,25(2):785-810.

[21]郝帅,杨磊,马旭,等. 基于注意力机制与跨尺度特征融合的

YOLOv5 输电线路故障检测[ J]. 中国电机工程学报,2023,

43(6):2319-2331.

[22]苏斐,张泽旭,赵妍平,等. 基于轻量化 YOLO-v3 的绿熟期番

茄检测方法[J]. 中国农机化学报,2022,43(3):132-137.

[23]吕宗旺,邱帅欣,孙福艳,等. 基于改进 YOLOv5s 的轻量化储

粮害虫检测方法[J]. 中国粮油学报,2023,38(8):221-228.

[24]王琳毅,白静,李文静,等. YOLO 系列目标检测算法研究进

展[J]. 计算机工程与应用,2023,59(14):15-29.

[25]张林鍹,巴音塔娜,曾庆松. 基于 StyleGAN2 -ADA 和改进

YOLOv7 的葡萄叶片早期病害检测方法[ J]. 农业机械学报,

2024,55(1):241-252.

[26]李任斯,石蕴玉,刘翔,等. 基于 Double-Head 的雾天图像目

标检测[J]. 液晶与显示,2023,38(12):1717-1727.

[27]李万艳,阮观强,张振东. 基于 YOLOv5 与迁移学习的目标检

测和机械臂抓取位姿估计[ J]. 机械传动,2024,48(3):170

-176.

[28]杨雨欣,于红,杨宗轶,等. 基于 Mel 声谱图与改进 SEResNet

的鱼类行为识别[J]. 渔业现代化,2024,51(1):56-63.

[29] SETIAWAN A, HADIYANTO H, WIDODO E C. Internet of

things for underwater shrimp image detection using blob detector

[ J]. International Journal on Advanced Science,Engineering and

Information Technology,2023,13(3):954-960.

[30] ZHOU H,KIM H S,KIM C S, et al. Instance segmentation of

shrimp based on contrastive learning [ J ]. Applied Sciences,

2023,13(12):6979-6993.

79

第82页

渔 业 现 代 化 2024 年

Research on the identification algorithm of crayfish body features

based on the improved YOLOv8n loss function

GENG Chunxin

1

,WANG Aimin

1,2

,YAN Tianyu

1

,YU Aonan

2

,ZHANG Haoxuan

2

,ZHANG Wuxiao

2

,

YANG Cheng

3

,LIU Xingguo

4

,ZHU Hao

4

,GU Xizhang

5

,LI Jinfeng

6

,SHAO Peng

7

(1 Information Engineering College of Yancheng University of Technology,Yancheng 224051,Jiangsu,China;

2 Marine and Biological Engineering College of Yancheng Institute of Technology,Yancheng 224051,Jiangsu,China;

3 Youji College of Yancheng Institute of Technology,Yancheng 224051,Jiangsu,China;

4 Fishery Mechinery and Instrument Research Institute,Chinese Acaderny of Fishery Science,Shanghai 200092,China;

5 Sheyang Liuhe Feed Co.,Ltd., Sheyang 224300,Jiangsu,China;

6 Jiangsu Jinfeng Agricultural Technology Co.,Ltd., Jianhu,224700,Jiangsu,China;

7 Yancheng Shangshui Environmental Biotechnology Engineering Co.,Ltd., Yancheng 224051,Jiangsu,China)

Abstract:The crayfish industry, primarily focused on Procambarus clarkii, is expanding rapidly but encounters

challenges due to inadequate automation. Traditional manual visual inspection methods used for evaluating

crayfish size and integrity during breeding and processing are labor-intensive and prone to errors. This study

presents an improved algorithm based on the YOLOv8n framework to intelligently recognize and grade crayfish

by accurately detecting the body, tail, and claws of Procambarus clarkii. The proposed approach introduces

innovation by replacing the original loss function CIoU ( Complete Intersection over Union) with MPDIoU

(Modified Perfect Dark Intersection over Union). A novel scale factor, denoted as the ratio, has been

introduced to adjust the size of the auxiliary bounding box within the loss calculation framework. This

improvement, in conjunction with the MPDIoU loss function, notably enhances the accuracy and efficiency of

bounding box regression. As a result, it enables the precise detection of the distinct body parts of crayfish, a

pivotal advancement in automating the grading process. Empirical assessments demonstrated substantial

enhancements in recognition accuracy. The incorporation of Inner-MPDIoU into the YOLOv8n model elevated

the mean Average Precision (mAP) from 83. 7% to 90. 8% across IoU thresholds ranging from 0. 5 to 0. 95.

The results of this study highlight the effectiveness of the proposed algorithm in precisely recognizing critical

elements of Procambarus clarkii. This investigation contributes to the overarching goal of attaining intelligent

and accurate grading within the crayfish domain, potentially transforming conventional practices and enhancing

industry productivity. The implications transcend mere automation, providing a groundwork for future

exploration into intelligent systems tailored to the unique requirements of the crayfish industry.

Key words:Procambarus clarkii; image recognition; YOLOv8; MPDIoU; deep learning

80

第83页

第 51 卷第 5 期 渔 业 现 代 化 Vol. 51 No. 5

2024 年 10 月 FISHERY MODERNIZATION Oct. 2024

DOI:10. 3969 / j. issn. 1007-9580. 2024. 05. 010 开放科学(资源服务)标识码(OSID):

陈庭槿,黄耀波,陈炫辛,等. 基于 Prune-YOLOv5s 的养殖鱼类缺氧风险评估方法[J]. 渔业现代化,2024,51(5):81-89.

收稿日期:2024-04-12

基金项目:深圳大学横向项目“基于深度学习的便携式水下成像及实时检测系统(横 KJ2023059)”;国家级大学生创新创业训练计划项

目“普惠智慧渔业管理系统(202310590046)”

作者简介:陈庭槿(2001—),男,研究方向:深度学习。 E-mail:1206235928@ qq. com

通信作者:刘英(1978—),女,副研究员,研究方向:智能数据分析,水下探测与成像。 E-mail:liuying-ipp@ szu. edu. cn

基于 Prune-YOLOv5s 的养殖鱼类缺氧风险评估方法

陈庭槿1

,黄耀波1

,陈炫辛2

,周纪军1

,刘 英1

(1 深圳大学物理与光电工程学院,广东 深圳 518061;

2 深圳大学教育学部,广东 深圳 518061)

摘要:为解决传统鱼类缺氧检测方法准确率不高、需耗费大量人力的问题,提出了一种基于 Prune-YOLOv5s

的养殖鱼类缺氧风险评估方法。 该方法首先采集鱼类缺氧进行水面呼吸(Aquatic surface respiration,ASR)时

的数据集,并训练 YOLOv5s 模型,然后用经轻量化改进的 YOLOv5s 模型实时检测鱼类缺氧进行水面呼吸的

行为,并引入鱼类 ASR 系数,设计鱼群缺氧评估模块实现鱼类缺氧风险评估。 最后通过鱼类缺氧试验对改

进前后 YOLOv5s 模型性能以及缺氧评估模块的准确率进行测试。 结果显示:与原模型相比,Prune-YOLOv5s

模型的性能得到明显提升,其中综合性能最优的 65% _Prune_YOLOv5s 模型,模型大小缩小至原模型的

45. 3%,在检测精度上提升 0. 6%,在推理速度上提升 23. 8%,在检测速度上提升 31. 4%。 鱼群缺氧评估模块

在测试集中的准确率可达 97. 4%,在鱼类缺氧试验周期中表现良好。 研究表明,基于 Prune-YOLOv5s 的养

殖鱼类缺氧风险评估方法能有效检测鱼类缺氧情况,准确给出风险提示,将在实际应用中具有较好的可

行性。

关键词:鱼类缺氧; 人工智能;深度学习;YOLOv5s; ASR 系数

中图分类号:TP 391;S 932. 2 文献标志码:A 文章编号:1007-9580(2024)05-0081-009

中国是渔业大国,水产养殖业作为中国渔业

的核心部分,其规模现已超 12 000 亿元[1-2]

。 缺

氧会对鱼类养殖造成诸多不良影响,包括摄食量

下降、生长速度减缓、繁殖能力降低,甚至窒息死

亡等[3-6]

,可能造成巨大的经济损失,因此由缺氧

而引起的养殖鱼类泛塘是养殖户最担心的问题之

一。 传统的鱼类缺氧检测是溶氧仪测试法和人工

观察法,前者由于水体环境复杂,易受环境干扰,

水体溶氧量可能存在较大差异,进而影响溶氧仪

的测试精度;后者则需要人工多次监视,耗费人力

大,同时主观判断存在较大误差,难以准确评估鱼

类缺氧情况。

当鱼类处于缺氧状态时,鱼类群体会表现出

某些特定行为以应对缺氧环境。 Kramer 等[7] 对

鱼类处于低氧条件下的行为进行分析,提出了群

体活动变化、空气呼吸增加、栖息地变化以及水面

呼吸增加这 4 大缺氧行为。 其中鱼类进行水面呼

吸(aquatic surface respiration,ASR)是指鱼在水和

空气的交界处, 嘴部在水下张开, 头部接触水

面[8-10]

,俗称“浮头”。 当溶氧量降低到某一阈值

后,进行 ASR 是大多数鱼类共有的群体性的行

为,并且随着溶氧量的降低,鱼类的 ASR 持续时

间也会增加[11-13]

。 故通过鱼群中进行 ASR 的鱼

比例以及 ASR 的持续时间这两个参量,即可有效

衡量鱼类缺氧情况。 根据国内外的相关研究,鱼

类的低氧耐受性会随着鱼类体型大小、种类、生理

状态的不同而不同[14]

,并且温度、水质、光照等环

境因素也会影响鱼类的缺氧情况,因此在一般情

况下鱼类缺氧的溶氧量阈值通常是不同的。 何伟

等[15]通过研究发现 10 ℃下鳊鱼的缺氧阈值约为

1. 39 mg / L,并随着温度升高而下降;Gee 等[10] 对

26 种鱼进行研究,发现不同种类的鱼进行 ASR 的

第84页

渔 业 现 代 化 2024 年

溶氧量阈值是不同的;Mustafa 等[16] 提出鲤鱼的

缺氧范围在 1. 8±1. 1 mg / L。 因此,相比于只通过

溶氧量数值的判断方法,通过检测鱼类在缺氧时

共有的群体性行为来评估鱼类的缺氧情况会更加

直接有效。

近年来计算机视觉技术在鱼类检测中的应用

日渐成熟。 Fernandes 等[17] 通过深度学习图像分

割技术成功检测鱼的体质量;赵梦等[18] 提出了

SK-YOLOv5 模型实现对养殖鱼群的检测,其识别

精度为 98. 86%;Zhao 等[19] 提出了改进的动能模

型以检测鱼群特殊行为,取得了良好的效果。 尽

管多数模型能取得较好效果,但模型的运行仍十

分依赖于高性能计算机,在性能普通的设备上可

能存在检测速度下降甚至无法运行等问题。 对视

频影像的鱼群实时检测来说,则要求模型检测速

度快[18]

。 另外计算机视觉技术在鱼类缺氧检测

应用方面的相关研究也比较稀少,吴昊峰等[20] 针

对工厂化养殖提出一种基于图像分类的鱼类缺氧

状态判断方法并在试验中顺利测试成功,但该方

法主要采用 ASR 持续时间进行判断,而并未将进

行 ASR 的鱼类在鱼群中所占比例这一重要参量

作为缺氧状态评估,存在一定缺陷。

本研究将提出基于 Prune -YOLOv5s 的养殖

鱼类缺氧风险评估方法,通过模型剪枝方法轻量

化 YOLOv5s 模型,减小模型大小,提高模型的检

测速度。 最后通过鱼类缺氧试验测试该方法的实

际效果,以期为鱼类缺氧的智能检测和自动控制

提供技术参考。

1 材料与方法

1. 1 设计方案

针对传统鱼类缺氧检测方法准确率不高、需

耗费大量人力的问题,本研究通过深度学习模型

对鱼类缺氧进行检测。 当缺氧时鱼类会呈现

ASR 的特殊动作形态,这与常见的水中游动形态

不同,故采集并制作了鱼类缺氧时进行 ASR 的缺

氧数据集。 在实际应用场景中,要求模型能对养

殖池进行实时检测,而普通设备无法匹配模型运

行的性能要求,会导致运行卡顿或失败等问题。

为了提高模型对设备的兼容性,采用通道剪枝方

法轻量化 YOLOv5s 模型,在保持较高检测精度的

同时,提高模型运行速度,减小内存占用。 本研究

利用计算机视觉技术检测鱼群的 ASR 情况,并由

此计算鱼类 ASR 系数实现对鱼类缺氧风险的量

化评估。 图 1 为基于 Prune-YOLOv5s 的养殖鱼

类缺氧风险评估方法的设计方案流程图。

ffi

fl

flffi

ffi





ffi

\"43 

\"43





flfl

ffi 



ffi 



 





 



fl

:0-0WT

 ffi

图 1 设计方案流程图

Fig. 1 Design flowchart

1. 2 数据集构建

搭建了鱼类缺氧测试系统,通过水下摄像机

采集了缺氧条件下(溶氧量≤1. 0 mg / L)

[21] 的鱼

类视频数据,大小为 5. 38 G。 通过 VMS 软件将视

频储存到计算机中。 然后对视频数据进行抽帧,

并挑选 3 954 张质量较好图像数据,图像分辨率

为 1 920×1 080。 通过 Labelimg 软件,对图片中的

缺氧鱼类进行标注,输出对应的 txt 标签文件,文

件中包含标注框 x、y 坐标、标注框长和宽以及类

别“fish”。 最后通过 Python 程序对标签数据以及

82

第85页

第 5 期 陈庭槿等:基于 Prune-YOLOv5s 的养殖鱼类缺氧风险评估方法

图片进行批量操作,按 8 ∶1 ∶1 划分成训练集、验证

集、测试集。

1. 3 鱼群检测模型

1. 3. 1 模型评估指标

采 用 了 检 测 精 度 mAP ( mean Average

Precision )、 模 型 大 小 ( model size )、 推 理 速 度

(inference speed)以及检测速度对模型性能进行

评估。 mAP 是所有类别平均精确度的均值,是模

型综合精度的度量。 模型大小是模型文件的存储

大小,能直接影响到模型在计算资源有限的设备

上部署效率,越小的模型越便于在设备上部署。

推理速度是模型对单个输入样本进行处理并输出

结果所需的时间,处理时间越短,代表模型处理样

本速度越快;而检测速度则是指模型处理视频的

实际速度,通常采用模型每秒可处理的帧数 FPS

(Frames Per Second) 来表示,FPS 越高代表模型

处理视频速度越快,实时性越好。 检测速度不仅

受模型推理速度的影响,也受设备计算资源的

影响。

1. 3. 2 轻量化模型设计策略

YOLOv5s 是 YOLOv5 系列模型中网络深度最

小、检测速度最快的模型[22]

,对设备性能要求较

低,在普通设备上能有良好的表现。

在提高模型检测效率、减小模型大小的轻量

化研究中,主要分为直接设计小模型和对训练好

的模型进行压缩的两大方向。 为了获得总体性能

更优的轻量化模型,在前期工作中,设计了基于深

度可 分 离 卷 积 轻 量 化 改 进 的 MobileNetV2 -

YOLOv5s

[23]

, 基 于 通 道 混 洗 轻 量 化 改 进 的

ShuffleNetV2-YOLOv5s

[24]以及基于通道剪枝轻量

化改进的 Prune-YOLOv5s

[25]

,3 种不同的轻量化

模型,并在一个包含 3 563 张分辨率为 640×512

鱼类图像的鱼类数据集中进行测试,测试结果如

表 1 所示。

表 1 模型测试结果

Tab. 1 Model test results

目标检测模型 模型大小/ MB 检测精度 FPS

YOLOv5s 13. 7 95. 8% 66

MobileNetV2-YOLOv5s 6. 39 92. 1% 50

ShuffleNetV2-YOLOv5s 2. 32 92. 7% 43

Prune-YOLOv5s 11. 2 95. 1% 72

测试结果表明,Prune-YOLOv5s 在检测精度

和轻量化程度上得到了平衡,在基本不损失准确

率的前提下,具有最快的检测速度。 因此,在后续

的工作中将 Prune-YOLOv5s 模型应用于鱼类缺

氧方向评估,以提高实时性。

1. 3. 3 通道剪枝处理的 YOLOv5s 模型

网络剪枝[26] 作为结构化剪枝的主要方法之

一,通过剪除冗余通道、重构输出特征图以及迭代

优化等操作,在尽量保持模型精度的前提下减小

模型大小,是一种常用的模型轻量化方法。 本文

对 YOLOv5s 模型进行通道剪枝,移除网络中冗余

通道,提高模型的检测速度,减小模型对设备性能

的依赖。

通道剪枝是通过在 BN(Batch Normalization,

批归一化)层对缩放因子 γ 施加 L1 正则化,促使

缩放因子趋近于零,当一个通道的缩放因子接近

零则代表经过该通道卷积后的输出仍为零,那么

该通道即被模型识别为冗余的通道[27-28]

。 引入

缩放因子稀疏化训练的损失函数如下:

L =

(

∑x,y)

l(f(x,W),y) + λ∑y∈Γ

g(y) (1)

式中:L 为训练的损失函数,x 为输入的训练数据;

y 为正确值;W 为权重参数;λ 为正则化系数,用

于控制稀疏性的强度。

g(γ) = γ (2)

式中:g(γ)代表对 γ 施加 L1 范数正则化,用于约

束模型参数大小和稀疏性。

在识别到冗余的通道后,即可通过 BN 层的

平移和缩放通道的功能,剪除掉冗余的通道。 结

合后的 BN 层输出如下:

^

z =

Zin

- μB

σ

2

B

+ ε

(3)

Zout

= γ^

z + β (4)

式中:Zin 为 BN 层的输入,Zout 为 BN 层的输出,

μB 和 σB 分别为输入激活函数 B 的平均值和标准

差值,β 为可训练参数。

剪枝后的模型会在验证集上评估其准确率,

模型剪枝后通常伴随着准确率的暂时减低,那么

则会对模型进行微调( fine-tuning) 操作,对剪枝

后的模型重新训练,以优化剩余通道的权重,提升

模型性能。

通道剪枝原理如图 2 所示。

83

第86页

渔 业 现 代 化 2024 年

J  NBTL K KffJ 

  

 





















图 2 通道剪枝原理图

Fig. 2 Channel pruning schematic

1. 4 鱼群缺氧评估模块

设计了相应的鱼群缺氧评估模块,通过鱼类

ASR 情况反映鱼类缺氧风险。 在鱼类 ASR 试验

上,多数学者采用过进行 ASR 的鱼类比例和 ASR

的持续时间这两个参数来评估鱼类的 ASR 情

况[29-31]

,进行 ASR 的鱼类比例越大、鱼类进行

ASR 的时间越长,代表鱼处于缺氧状态越严重,

故通过这两个参数计算鱼类的 ASR 系数,并以此

评估鱼类缺氧风险。 公式如下:

F =

∑i = t

ni

N·t

(5)

式中:F 为 ASR 系数,代表鱼类平均每秒进行

ASR 的比例;n 为模型每秒检测到进行 ASR 的鱼

类数目;N 是鱼群总数,本研究主要针对工厂化养

殖,养殖鱼群总数 N 是可以事先得知或通过将摄

像头安装在适当位置预先采集得到;t 为 ASR 系

数计算的时间窗口。

算法逻辑图如图 3 所示。

 ffifl



\"43

ffi O

\"43 '



flfl 

fl

flfl 

\"43 'ff

/P

/P

/P

:FT

:FT

:FT

图 3 鱼群缺氧评估模块流程图

Fig. 3 Flow chart of fish hypoxia assessment module

首先通过鱼群检测模块对输入的鱼类影像视

频进行检测,获取每秒鱼类进行 ASR 的数目并以

此计算鱼类 ASR 系数,当 F 大于等于设定的 ASR

缺氧系数阈值 F0 ,说明鱼类缺氧风险高,程序在

84

第87页

第 5 期 陈庭槿等:基于 Prune-YOLOv5s 的养殖鱼类缺氧风险评估方法

视频中输出缺氧风险提示;在输出缺氧风险提示

后,用户采取增氧措施使鱼摆脱缺氧状态,鱼类不

再进行 ASR 即 F = 0 时,开始统计风险解除时间

t

1 ,当统计到 t

1≥风险解除时间阈值 t

0 时,解除缺

氧风险提示。 通过设置风险解除时间以确保鱼类

真正恢复到正常状态,有效降低鱼类缺氧风险。

模块会在视频中实时显示鱼类 ASR 系数,为用户

评估鱼类缺氧风险提供便利。

2 测试方法

2. 1 鱼类缺氧测试系统

鱼类缺氧测试系统由直径 47 cm、高 50 cm 的

养殖池(水深约 40 cm),搭配 200 万像素的网络

摄像机(哈克思特 HK90A),打氧机(AQ-2000F,

28 W),溶氧仪(AZ8403) 和计算机组成,如图 4

所示。













DN

DN

 DN

图 4 鱼类缺氧测试系统

Fig. 4 Fish hypoxia test system

摄像机固定在水平面下方,打氧机和溶氧仪

固定在养殖池中部。 计算机放置在养殖池附近的

工作台,通过 5 m 长的网络线缆与摄像机相连,减

少人类活动引起鱼类行为反常。 使用软件(由哈

克思特提供)进行视频采集。 试验以禾花鱼为研

究对象。 养殖池养殖 10 条鱼(体质量约 43. 3 g,

体长约 13 cm)。 试验前将鱼在养殖池中培养至

少 4 周,可认为已经适应了饲养环境。

2. 2 模型运行环境及参数配置

操作系统为 Windows 10 专业工作站版,GPU

为 NVIDIA GeForce RTX2080TI,CPU 为 Intel(R)

Xeon(R) Gold512@ 2. 20 GHz 2. 19 GHz(双处理

器),硬盘为 475DB NTFS(数量为 4),内存为 SK

128GB DIMM 2400MHz; GPU 加 速 计 算 架 构 为

CUDA 11. 3,程序开发语言为 Python 3. 6,深度学

习框 架 为 Pytorch 1. 7, 加 速 神 经 网 络 库 为

CuDNN8. 2. 0,计算机视觉库为 OpenCV 4. 7. 0;模

型选用 YOLOv5s,Backbone 为 CSPDarknet53,学

习率 根 据 余 弦 退 火 算 法 确 定, Batchsize 为 8,

Epoch 数为 100。

2. 3 测试步骤

在上述测试系统中,通过打氧机使水中溶氧

量上升到正常值,再关闭打氧机让溶氧量自然下

降,当溶氧量≤1. 0 mg / L,即鱼类处于缺氧时,重

新启动打氧机使溶氧量恢复正常水平。 在此鱼类

缺氧试验的过程中,启动摄像机实时记录鱼类活

动的同时,通过溶氧仪记录对应时间下的溶氧量。

重复多次操作并记录多个鱼类缺氧周期,最后将

摄像机采集到的视频数据上传到计算机中,由模

型进行检测试验。

3 结果与分析

3. 1 Prune-YOLOv5s 模型

剪枝率的大小会影响模型性能,故采用相同

的数据集分别训练 YOLOv5s 模型与不同剪枝率

下的 Prune-YOLOv5s 模型以进行性能对比。 同

时通过检测同一鱼类视频评估各个模型的检测速

度。 试验结果如表 2 所示,其中以“剪枝率_Prune

_ YOLOv5s ” 代 表 对 应 剪 枝 率 下 的 Prune _

YOLOv5s。

表 2 YOLOv5s 模型与不同剪枝率下的 Prune-YOLOv5s

模型性能对比

Tab. 2 Performance comparison between YOLOv5s model

and Prune-YOLOv5s models under different

pruning rates

模型

检测

精度

模型大小

/ MB

推理时间

/ ms

FPS

YOLOv5s 95. 7% 13. 70 17. 2 49. 48

15%_Prune_YOLOv5s 96. 1% 11. 40 15. 9 54. 93

25%_Prune_YOLOv5s 96. 5% 10. 25 15. 3 56. 80

35%_Prune_YOLOv5s 96. 7% 9. 11 14. 8 58. 46

45%_Prune_YOLOv5s 96. 1% 8. 11 14. 0 61. 26

55%_Prune_YOLOv5s 96. 4% 6. 92 13. 5 63. 28

65%_Prune_YOLOv5s 96. 3% 6. 20 13. 1 65. 00

由试验结果可知,相比于 YOLOv5s 模型,剪

85

第88页

渔 业 现 代 化 2024 年

枝后的 YOLOv5s 模型在速度上获得了明显提升。

并且随着剪枝率的上升,Prune-YOLOv5s 模型的

推理速度及检测速度也随之上升,推理速度最多

提升了 23. 8%,达到 13. 1 ms,而检测速度最高提

升了 31. 4%,达到 65. 00 FPS。 由于规模较小、复

杂度低的简单数据集,不需要过多的通道提取特

征,冗余的通道较多,故而能使模型在尽量保持原

有检测精度的前提下,剪掉许多参数[28]

,因此剪

枝后 YOLOv5s 模型大小明显减小,在保持原有检

测精度的前提下,模型大小最高可被压缩至原模

型的 45. 3%。 上述结果表明模型剪枝有效轻量

化了 YOLOv5s 模型,有利于模型在计算资源有限

的设备上顺利运行。

在检测精度上,模型剪枝后却有略微提升,

mAP 提升了 0. 4% ~1. 0%。 这是因为数据集复杂

度较低,模型的检测精度在微调操作中不仅能很

快恢复到原有精度,甚至可能超越原有模型。

由于 65%_Prune_YOLOv5s 模型在具有较好

的检测精度的同时,其模型大小及检测速度表现

最优,故将用于后续研究中。

3. 2 鱼群缺氧评估模块

基于上述测试系统,展开了多次鱼类缺氧试

验,记录了在 2023 年 11 月—2024 年 2 月期间,总

时长为 88 h 的试验数据。 当溶氧量≤1. 0 mg / L

时,鱼类会出现群体性 ASR 的情况,表示处在缺

氧状态。 根据公式(5)分别计算缺氧和不缺氧状

态下的鱼类 ASR 系数,结果显示,鱼类缺氧时

ASR 系数为 0. 15~0. 36,不缺氧时的 ASR 系数为

0. 00 ~ 0. 09。 由于测得缺氧的 ASR 系数最低为

0. 15,故将 ASR 缺氧系数阈值 F0 设置为 0. 15,使

程序能及时给出风险提示。 在实际应用过程中可

以把 F0 值设低一些,虽然可能会出现一些误报

警,但可以避免漏报情况。 解除报警时间阈值 t

0

可以根据养殖池大小和打氧机的功率计算得到,

或根据经验来设置,目的是通过打氧后确保溶氧

量上升,鱼群已摆脱缺氧状态,解除报警时间阈值

t

0 设置为 7 min。 采用测试集对缺氧评估模块进

行测试,测试集主要由 15 个鱼类缺氧视频以及

24 个鱼类不缺氧视频组成,为了确认鱼类是稳定

地处于某一状态下,故每段测试视频时长均不低

于 2 h。 模块检测效果如表 3 所示。

表 3 模块在测试集中的检测效果

Tab. 3 The detection effect of the model in the test set

测试集 测试集数量 模型准确预测数量 检测准确率

缺氧 15 15 100. 0%

不缺氧 24 23 95. 8%

总计 39 38 97. 4%

试验结果显示,模块均能在鱼类缺氧时准确

发出风险提示,仅一次在不缺氧时错误发出提示,

检测准确率为 97. 4%。 同时为了进一步验证模

型的实际应用效果,试验模拟并记录了鱼类从常

氧到缺氧,再通过打氧机让溶氧量恢复到常氧的

周期,并由模块对该试验周期进行检测,检测效果

如图 5、图 6 所示。 图 5 为鱼群缺氧评估模块的

效果图,其中图 5a 展示了在未缺氧时没有鱼类进

行 ASR,ASR 系数为 0,不输出风险提示的情况,

而图 5b 展示了在缺氧时,鱼类进行 ASR 且 ASR

系数超过 F0 ,输出风险提示的情况。 图 6 为试验

周期中溶氧量、ASR 系数、风险提示的实测曲线,

其中用 1 和 0 分别表示是否发出风险提示。

B

C

图 5 模块检测效果图

Fig. 5 Model testing effect diagram

NJO



 NH-

fl

fl



      

\"43

flfl 

































&

\" %

$

#

图 6 溶氧量、ASR 系数、风险提示实测曲线

Fig. 6 Measured curves of dissolved oxygen,ASR

coefficient and risk warning

试验结果显示,模块预测结果与实际试验情

86

第89页

第 5 期 陈庭槿等:基于 Prune-YOLOv5s 的养殖鱼类缺氧风险评估方法

况基本吻合。 溶氧量降低至 1. 0 mg / L 后,鱼群因

缺氧而逐渐开始进行 ASR(图 6 的 A 点处),随着

处于缺氧状态的时间增加,ASR 持续时间增加,F

也随之增大,并在测试周期的 155 min 时(图 6 的

B 点处)F>F0 ,说明鱼类已经出现群体性较长时

间缺氧,存在较为严重的缺氧风险,则出现缺氧风

险提示。 在确认鱼类已处于缺氧状态后,在 200

min 时(图 6 的 C 点处)启动打氧机增氧,鱼类不

再进行 ASR,F 逐渐降低至 0,并当在 F 保持一定

时间 t

0 后,于 220 min 取消缺氧风险提示(图 6 的

D 点处);其中,t

0 的作用是为鱼类在缺氧和不缺

氧状态的转换过程中提供一定的缓冲时间,降低

鱼类缺氧风险。

虽然该评估模块能较好地实现对鱼类缺氧风

险评估,但仍有一定误差存在。 这是由于鱼类在

使用 ASR 这一行为上具有一定的灵活性[7,32]

这样的灵活性主要体现在:一方面,在未达到低氧

前,鱼 类 可 能 受 水 质、 温 度、 低 氧 耐 受 性 等 因

素[32-33]的影响,而短暂进行 ASR,这也使得在正

常溶氧量水平下,ASR 系数的数值存在小范围的

浮动。 另一方面,鱼类可根据低氧程度调节进行

ASR 的时间比例[32]

,并且光照变化、环境噪声等

环境因素容易使鱼类受惊吓[34]

,故导致在低氧条

件下鱼类可能存在部分时间段不进行 ASR,这也

解释了在试验中 128~138 min 这段时间内没有鱼

类进行 ASR。

4 结论

本研究提出了一种基于 Prune -YOLOv5s 的

养殖鱼类缺氧风险评估方法,采用深度学习模型

检测鱼类 ASR 情况,并引入 ASR 系数实现对鱼

类缺氧风险评估。 借助鱼类缺氧试验对该方法进

行测试,结果表明:相比于 YOLOv5s 模型,PruneYOLOv5s 模型在模型大小、推理速度、检测速度

以及检测精度上均得到提升,其中 65% _Prune_

YOLOv5s 模型综合表现最优,其模型大小缩小至

原模型的 45. 3%,推理速度提升 23. 8%,检测速

度提升 31. 4%,检测精度也提升了 0. 6%。 在鱼

类缺氧测试集中,鱼群缺氧评估模块可以准确检

测鱼类缺氧情况并发出风险提示,检测准确率为

97. 4%,并且在模拟的试验周期中具有良好表现。

本研究的重点在于提出基于计算机视觉的鱼类缺

氧风险评估方法,并通过测试验证其可行性。 将

摄像头安装于水下检测鱼群,这一做法提高了检

测的准确性,却也限制了摄像头的可视范围。 面

对较大的养殖池,虽然可以通过增设摄像头来实

现全面监控,但这会增加经济成本。 为了解决这

一矛盾,未来的工作中将为模型融入目标追踪算

法,通过捕捉水面鱼类的行为轨迹来评估鱼类缺

氧风险或健康状况,以提升该方法的实用性。

参考文献

[1] 农业农村部渔业渔政管理局,全国水产技术推广总站,中国

水产学会. 中国渔业统计年鉴[ M]. 北京:中国农业出版

社,2024.

[2] 莽琦,徐钢春,朱健,等. 中国水产养殖发展现状与前景展望

[J]. 渔业现代化,2022,49(2):1-9.

[3] WU S S,ZHOU S B,RANDALL J D,et al. Aquatic hypoxia is an

endocrine disruptor and impairs fish reproduction [ J ].

Environmental Science Technology,2003,37(6):1137-1141.

[4] SHANG E H,WU R S. Aquatic hypoxia is a teratogen and affects

fish embryonic development [ J ]. Environmental science

technology,2004,38(18):4763-4767.

[5] 徐贺,陈秀梅,王桂芹,等. 低氧胁迫在水产养殖中的研究进

展[J]. 饲料工业,2016,37(2):33-37.

[6] ABDEL-TAWWAB M,HAGRAS A,ELBAGHDADY H, et al.

Dissolved oxygen level and stocking density effects on growth,

feed utilization,physiology,and innate immunity of nile tilapia,

Oreochromis niloticus[J]. Journal of Applied Aquaculture,2014,

26(4):340-355.

[7] KRAMER D L. Dissolved oxygen and fish behavior [ J ].

Environmental Biology of Fishes,1987,18(2):81-92.

[8] URBINA A M,FORSTER E M, GLOVER N C. Leap of faith:

Voluntary emersion behaviour and physiological adaptations to aerial

exposure in a non-aestivating freshwater fish in response to aquatic

hypoxia[J]. Physiology Behavior,2011,103(2):240-247.

[9] SLOMAN K A,WOOD C M,SCOTT G R,et al. Tribute to R. G.

Boutilier:the effect of size on the physiological and behavioural

responses of oscar, Astronotus ocellatus, to hypoxia [ J ]. The

Journal of experimental biology,2006,209(7):1197-1205.

[10]GEE J H,TALLMAN R F,SMART H J. Reactions of some great

plains fishes to progressive hypoxia [ J]. Canadian Journal of

Zoology,1978,56(9):1962-1966.

[11 ] RICHARDS J G. Physiological, behavioral and biochemical

adaptations of intertidal fishes to hypoxia [ J]. The Journal of

experimental biology,2011,214(2):191-199.

[12]KRAMER D L,MEHEGAN J P. Aquatic surface respiration,an

adaptive response to hypoxia in the guppy, Poecilia reticulata

(Pisces, Poeciliidae ) [ J ]. Environmental Biology of Fishes,

87

第90页

渔 业 现 代 化 2024 年

1981,6(3):299-313.

[13]李洁. 限制溶解氧供应对褐牙鲆幼鱼生长的影响及其机制

的实验研究[D]. 青岛:中国海洋大学,2012.

[14] COLT J,ORWICZ K,BOUCK G. Water quality considerations

and criteria for high - density fish culture with supplemental

oxygen[ M]. Bethesda,MD:American Fisheries Society,1991:

372-385.

[15]何伟. 温度对几种鲤科鱼类低氧耐受及生化反应的影响

[D]. 重庆:重庆师范大学,2014.

[16]MUSTAFA S A,AL-SUBIAI S N,DAVIES S J,et al. Hypoxiainduced oxidative DNA damage links with higher level biological

effects including specific growth rate in common carp,Cyprinus

carpio L[J]. Ecotoxicology,2011,20(6):1455-1466.

[17]FERNANDES A F A,TURRA E M,ALVARENGA R R D,et al.

Deep learning image segmentation for extraction of fish body

measurements and prediction of body weight and carcass traits in

Nile tilapia[J]. Computers and Electronics in Agriculture,2020,

170:105274.

[18]赵梦,于红,李海清,等. 融合 SKNet 与 YOLOv5 深度学习的

养殖鱼群检测[ J]. 大连海洋大学学报,2022,37 ( 2):312

-319.

[19]ZHAO J,GU Z,SHI M,et al. Spatial behavioral characteristics and

statistics - based kinetic energy modeling in special behaviors

detection of a shoal of fish in a recirculating aquaculture system[J].

Computers and Electronics in Agriculture,2016,127:271-280.

[20]吴昊峰. 基于多源数据模型的工厂化循环水水产养殖精准

曝气策略[D]. 重庆:重庆工商大学,2022.

[21]刘玉兰,刘娟,韩世涛,等. 鱼塘浮头预报方法研究[ J]. 宁夏

农林科技,2011,52(9):107-109.

[22]赵新龙,顾臻奇,李军. 基于 YOLOv5s 和改进 SORT 算法的

黑水虻幼虫计数方法[ J]. 农业机械学报,2023,54(7):339

-346.

[23]SANDLER M,HOWARD A,ZHU M,et al. Mobile Net V2:Inverted

Residuals and Linear Bottlenecks [ C] / / IEEE. 2018 IEEE/ CVF

Conference on Computer Vision and Pattern Recognition,Salt Lake

City,USA:IEEE/ CVF,2018:4510-4520.

[24]SU J, YANG M, TANG X. Integration of Shuffle Net V2 and

YOLOv5s Networks for a Lightweight Object Detection Model of

Electric Bikes within Elevators[ J]. Electronics,2024,13 ( 2):

394-410.

[25]周纪军. 基于深度学习的便携式鱼类实时检测系统的研究

与实现[D]. 深圳:深圳大学,2023.

[26]HE Y,ZHANG X. SUN J. Channel pruning for accelerating very

deep neural networks [ C ] / / IEEE. Proceedings of the IEEE

International Conference on Computer Vision. Venice, Italy:

IEEE,2017:1398-1406. .

[27]LAI Z,MO D,WONG W K,et al. Robust discriminant regression

for feature extraction [ J ]. IEEE transactions on cybernetics,

2017,48(8):2472-2484.

[28]LIU Z,LI J, SHEN Z, HUANG G, et al. Learning efficient

convolutional networks through network slimming [ C] / / IEEE.

Proceedings of the IEEE International Conference on Computer

Vision. Venice,Italy:IEEE,2017:2736-2744.

[29]SHINGLES A,MCKENZIE D J, CLAIREAUX G, et al. Reflex

cardioventilatory responses to hypoxia in the flathead gray mullet

(Mugil cephalus) and their behavioral modulation by perceived

threat of predation and water turbidity [ J ]. Physiological &

Biochemical Zoology Pbz,2005,78(5):744-755.

[30]余欣欣. 低氧对团头鲂鳃形态结构、细胞凋亡及相关基因表

达的影响[D]. 上海:上海海洋大学,2023.

[31]王嘉伟. 大菱鲆低氧耐受能力及生理指标变化研究[D]. 上

海:上海海洋大学,2022.

[32]JEAN-MICHEL W, KRAMER D L. Effects of hypoxia and

surface access on growth, mortality, and behavior of juvenile

guppies,Poecilia reticulata [ J]. Canadian Journal of Fisheries

and Aquatic Sciences,1983,40(7):836-844.

[33]徐建瑜. 基于计算机视觉的急性应激条件下尼罗罗非鱼的

行为研究[D]. 杭州:浙江大学,2005.

[34]郭志文. 深秋到来华中地区昼夜温差大,泛塘事件频发引发

的几点思考[J]. 当代水产,2018,43(11):96-97.

88

第91页

第 5 期 陈庭槿等:基于 Prune-YOLOv5s 的养殖鱼类缺氧风险评估方法

Anoxic risk assessment method for cultured fish

based on Prune-YOLOv5s

CHEN Tingjin

1

,HUANG Yaobo

1

,CHEN Xuanxin

2

,ZHOUJijun

1

,LIU Ying

1

(1 College of Physics and Optoelectronic Engineering,Shenzhen University,Shenzhen 518061,Guangdong,China;

2 Factulty of Education,Shenzhen University,Shenzhen 518061,Guangdong,China)

Abstract:To address the issue of the traditional fish hypoxia detection methods, which have low accuracy and

require a lot of labor, a Prune-YOLOv5s-based hypoxia risk assessment method for farmed fish is proposed.

This paper introduces a hypoxia risk assessment method for cultured fish based on the Prune - YOLOv5s

algorithm. This method first collects data on aquatic surface respiration ( ASR) performed by fish under

hypoxic conditions to create a data set for fish hypoxia. The dataset is then utilized to train the YOLOv5s

model. Then, the lightweight and improved YOLOv5s model was used to monitor the behavior of fish surface

respiration during hypoxia in real-time. The introduction of the ASR coefficient allows for quantifying ASR

instances in fish, which indicates hypoxia risk. The fish hypoxia assessment module is designed to evaluate the

risk of hypoxia. The improved performance of the YOLOv5s model before and after modifications and the

accuracy of the fish hypoxia assessment module are tested through the fish hypoxia experiment. The test results

show that compared with the YOLOv5s model, the detection accuracy, model size, inference speed, and

detection speed of the PruneYOLOv5s model have been significantly improved. Among them, the detection

accuracy of the 65% PruneYOLOv5s model, which has the best comprehensive performance, has been

increased by 0. 6% compared with the original model. The size of the model is reduced to 45. 3% of the

original model. The inference speed is improved by 23. 8%, and the detection speed is enhanced by 31. 4%.

The fish hypoxia assessment method achieves 97. 4% accuracy in the test set of 39 test videos and performs

well in the hypoxia cycle experiment. The research indicates that the Prune-YOLOv5s-based hypoxia risk

assessment method for cultured fish can effectively detect hypoxic conditions and provide accurate risk alerts,

showing high feasibility for practical application.

Key words:fish hypoxia; artificial intelligence; deep learning; YOLOv5s; ASR coefficient

89

第92页

第 51 卷第 5 期 渔 业 现 代 化 Vol. 51 No. 5

2024 年 10 月 FISHERY MODERNIZATION Oct. 2024

DOI:10. 3969 / j. issn. 1007-9580. 2024. 05. 011 开放科学(资源服务)标识码(OSID):

蒋飞,李皞,李雅琴,等. 基于注意力机制的 DM-BCNN 鲨鱼种群细粒度分类方法[J]. 渔业现代化,2024,51(5):90-101.

收稿日期:2024-05-15

基金项目:湖北省重点研发计划(2023BBB046)

作者简介:蒋飞(1999—),男,硕士研究生,研究方向:细粒度图像分类检测。 E-mail:feijiang1299@ 163. com

通信作者:李雅琴(1980—),女,教授,研究方向:图像处理、智能检测、机器学习等。 E-mail:leeyaqin@ whpu. edu. cn

基于注意力机制的 DM-BCNN 鲨鱼种群细粒度分类方法

蒋 飞,李 皞,李雅琴,肖松宴,刘天玮

(武汉轻工大学数学与计算机学院,湖北 武汉 430048)

摘要:为提高鲨鱼种群细粒度分类的准确率,解决数据集图像干扰因素多、图像局部关键特征提取不足、通道

语义关联欠缺等问题,提出了一种基于改进双线性卷积神经网络 B-CNN 模型的 DM-BCNN 鲨鱼种群细粒度

分类模型。 首先,引入可变形卷积将原模型中的特征提取部分替换为 DRAM_ResNet 网络结构,提升模型对

复杂非规则形状和局部结构的检测能力;然后在此基础上采用 NAM 注意力机制,加强模型对关键特征的识

别提取能力;最后引入互通道损失函数,增强鲨鱼图像不同通道间的语义关联性,使得模型可以更全面地捕

捉图像不同方面的信息。 结果显示:改进模型 DM-BCNN 在 Top-1 准确率达到了 96. 12%,相较于原模型提

升了 2. 51 个百分点。 研究表明,改进模型相比原模型在细粒度图像分类上的表现更加出色,对鲨鱼种群的

细粒度分类识别更加有效。

关键词:鲨鱼;细粒度图像;注意力机制;可变形卷积;互通道损失

中图分类号:X171;S966 文献标志码:A 文章编号:1007-9580(2024)05-0090-012

鲨鱼种群细粒度分类[1] 是指在视觉上相似

的鲨鱼种类之间进行精细区分,以便准确识别每

个种类。 该任务面临图像干扰因素多、关键特征

难以准确提取等一系列挑战,如鲨鱼的斑点形状、

鳍的长度、颜色的变化等只有细微的差别,且图像

由于鲨鱼活动体态多样、光照变化、背景复杂、水

下浑浊等因素导致难以捕捉关键特征,通过提升

对鲨鱼种群的细粒度分类识别,可以为后续不同

类别鲨鱼种群的生活习性研究和生存环境保护提

供有力的参考和方法基础,这一研究是了解鲨鱼

种群[2]和海洋生物多样性的重要任务。

在研究初期,人们通过传统的人工计算对鲨

鱼及海洋生物的多样性和生存环境进行评估,一

些传统的鲨鱼和水下生物分类识别方法存在人工

选取的目标特征不够精确且主观性过强的问

题[3]

,在时代飞速发展的今天,传统方法由于其

复杂度和准确度的问题已经难以跟进研究。 相比

一些传统的海洋生物种类分类识别方法,近些年

出现了许多以深度学习作为研究工具的分类识别

方法,并在鲨鱼和水下生物分类识别领域取得了

较好的效果[4]

。 Kilfoil 等[5] 使用一种基于诱饵远

程水下视频系统(BRUVS)的视频分析方法对鲨鱼

行为进行监测评估,以此解决鲨鱼研究中存在的研

究数据人工误判的问题。 董绍江等[6] 提出一种分

层精简双线性注意力网络来对水下鱼类进行识别,

以此强化水下鱼类图像的细粒度特征提高分类精

度。 龚瑞昆等[7]提出了一种 EfficientNetV2-HDCA

模型,通过混合空洞卷积和坐标注意力机制解决

了水下鱼类模型抗干扰能力差以及鱼类关键部位

特征提取不够全面的问题。 以上的研究为鲨鱼种

群的细粒度分类提供了参考和有力的依据。

近些年,采用的基于深度学习的鲨鱼种群及

水下鱼类分类识别方法仍有待改进。 首先,由于

海洋水下环境普遍偏黑且样本数量不均衡,再者

拍摄时环境、光线、角度、生物体态的不同,可能会

出现同一生物图像差异较大的问题[8]

,这些问题

导致的数据集质量参差不齐,一定程度上会影响

细粒度分类模型训练时的准确度。 其次,因为鲨

第93页

第 5 期 蒋飞等:基于注意力机制的 DM-BCNN 鲨鱼种群细粒度分类方法

鱼种群间从外观体态上看有许多方面相似度很

高,会导致类间差异小、类内差异大难以区分[9]

此外,一般的细粒度分类模型采用的是强监督的、

需要通过人工标注特征区域的模型,这种模型标

注代价太高,使得研究效率变低。

本研究选用细粒度分类弱监督 Bilinear CNN

模型[10]作为研究的基础网络框架,不需要对数据

集图像进行繁杂地标注,只需设置好对应的分类

名称 即 可。 在 此 基 础 上 引 入 NAM 注 意 力 机

制[11]

、可变形卷积和互通道损失函数[12]

,提出了

一种基于注意力机制的 DM-BCNN 鲨鱼种群细粒

度分类算法,可有效提升鲨鱼种群分类识别的准

确率,为不同鲨鱼种群生活习性和海洋生存环境

的研究提供了一种新的方法。

1 材料与方法

1. 1 数据集制作

鲨鱼种群数据集以海洋工作者制作的公开数

据集为基础,并通过截取各种海底鲨鱼种群的视

频图像片段以及爬取网络上各种海底环境的鲨鱼

图片来进一步扩充数据集。 经过整理、补充和完

善的鲨鱼种群数据集的样本均是从真实海洋环境

中获取。 鲨鱼种群数据集包含有 14 个鲨鱼种类,

每个种类均包含 250 张对应类别图像,共 3 500

张图像,其中的鲨鱼种群如大白鲨、灰鲭鲨、沙虎

鲨等均属于易危或濒危种群,鲨鱼种群数据集如

表 1 所示。

表 1 鲨鱼图像数据集的构建与处理

Tab. 1 Construction and processing of shark image dataset

标签 种类 英文名 总数/ 张

0 姥鲨 Basking shark 250

1 黑鳍鲨 Blacktip shark 250

2 蓝鲨 Blue shark 250

3 公牛鲨 Bull shark 250

4 锤头鲨 Hammerhead shark 250

5 柠檬鲨 Lemon shark 250

6 灰鲭鲨 Mako shark 250

7 护士鲨 Nurse shark 250

8 沙虎鲨 Sand tiger shark 250

9 长尾鲨 Thresher shark 250

10 虎鲨 Tiger shark 250

11 鲸鲨 Whale shark 250

12 白鲨 White shark 250

13 白鳍鲨 Whitetip shark 250

由于海底的环境大多相似,故采用人工方法将

一部分高度相似图像筛除并通过旋转平移、高斯模

糊、随机遮挡等数据增强的方式扩充了数据集以增

加数据集对于模型的泛化性和鲁棒性[13]

。 最后,

将 3 500 张图片按照 8 ∶2 划分为训练集和验证集,

以此对鲨鱼种群细粒度分类模型进行训练和验证。

数据集部分样本图像如图 1 所示。

ffi ffiffiffi ffi ffi ffi

ffi ffiffi

ffi ffi ffiffi

图 1 数据集样本示例

Fig. 1 Sample data set example

1. 2 B-CNN 网络模型

双线 性 卷 积 神 经 网 络 ( Bilinear CNN, B -

CNN)是一种为解决细粒度视觉识别问题而设计

的简单有效的网络架构。 此 B-CNN 网络模型通

过两个卷积神经网络(CNN) 特征的外积来表示

图像,并 以 平 移 不 变 的 方 式 捕 获 局 部 特 征 交

互[14]

。 双线性卷积神经网络分为以 VGG 特征提

取部分为基础的 stream A 和 stream B 两个网络部

91

第94页

渔 业 现 代 化 2024 年

分,这两部分相互协调以完成目标及局部区域的

检测与特征提取,网络 A 主要负责目标的定位,

即执行目标与局部区域的检测任务,而网络 B 则

致力于对网络 A 检测到的目标位置进行特征提

取[15]

。 在这个框架下,网络 A 的目标定位能力为

网络 B 的特征提取提供了空间上的指导,而网络

B 通过对定位到的目标或区域进行深层特征提

取,为细粒度分类任务提供了丰富的特征表示。

这种联合作用使得 B-CNN 能够有效地捕捉和利

用图像中的细粒度信息,从而实现高精度的细粒

度视觉识别。

在鲨鱼种群细粒度分类任务中,网络 A 用于

对鲨鱼的不同位置进行定位,网络 B 用于提取鲨

鱼鱼尾、鱼鳍等具有一定辨识度的特定部位信息,

通过这两部分网络的联合可提高鲨鱼种群细粒度

图像的分类精确率。

本研究以双线性卷积网络 B-CNN 作为鲨鱼

种群分类的基础网络模型,并在此基础上作出了一

系列改进用以提升鲨鱼种群分类的性能和效果。

B-CNN 的总体网络结构如图 2 所示。

$// TUSFBN\"

7((

$// TUSFBN#

$POWPMVUJPOBM QPPMJOH MBZFST

#JMJOFBS WFDUPS

TPGUNBY

CMVF

TIBSL

图 2 Bilinear CNN 网络结构图

Fig. 2 Bilinear CNN network structure diagram

一个 Bilinear CNN 模型由四元组构成,组中

包含 fA 和 fB 两个不同的特征,以及 Pooling 操作

和分类器;对特征的每一个位置,进行如下公式

(1)的计算。

Bilinear(l,I,fA ,fB ) = fA(l,I)

T

fB(l,I) (1)

此公式对特征输出在每个位置通过矩阵外积

进行组合,为位置 l 处 fA 和 fB 的双线性特征组

合。 式中 fA 和 fB 为两个不同的特征函数,I 代表

图像,l 代表图像所在位置[16]

。 对于图像 I 在位

置 l 的两个特征 fA(l,I)∈R

T×M 和 fB(l,I)∈R

T×N

,

进行如下公式(2)的操作:

b(l,I,fA,fB ) = f

T

A(l,I)fB(l,I) ∈ R

M×N

ξ(I) = ∑

A

l

b(l,I,fA,fB ) ∈ R

M×N

x = vec[ξ(I)] ∈ R

MN×1

y = sign(x) x ∈ R

MN×1

z = y / y 2 ∈ R

MN×1

ì

î

í

ï

ï

ï

ï

ï

ï

ï

ï

(2)

该公式将和特征图同一位置上的特征进行

矩阵相乘[17]

,得到矩阵 b,对所有位置的 b 进行

sum pooling 得到矩阵 ξ。 例如,对于一个 CNN,

输入的特征图有 c 个通道数,那么在位置 I 上的

特征就是 1 ×c 的大小,然后与同一位置上不同

CNN 得到的 1 × c 的矩阵进行乘积得到 c × c 矩

阵,再者将所有位置上的 c×c 矩阵进行求和得到

ξ,再转换成向量的形式则可得到 Biinear vector,

即上述公式( 2) 中的 x。 对 x 进行 y = sign ( x)

x 操作,再对得到的 y 进行 L2 归一化操作

z =

y

y 2

,即可把特征 z 用于细粒度图像分类。 所

以 Bilinear CNN 模型由于其优异的泛化性能,不

仅在细粒度图像分类上取得了优异效果,还可

被用于其他图像分类任务。

1. 3 改进的 DM-BCNN 网络框架

在鲨鱼种群细粒度图像分类的研究中,由于

图像是在海底环境中拍摄,鲨鱼图像往往面临着

背景颜色暗淡且单调,以及海底其他鱼类和植物

的干扰,这些因素共同导致鲨鱼的特征不够明显

92

第95页

第 5 期 蒋飞等:基于注意力机制的 DM-BCNN 鲨鱼种群细粒度分类方法

和清晰。 为了克服这些挑战,本研究采用了双线

性卷积神经网络(B-CNN)作为基础模型,该模型

以 VGG 网络为特征提取器,因其结构简单且高

效,易于理解和搭建,在细粒度分类任务中有良好

的表现。 但由于鲨鱼图像存在颜色暗淡单调、环

境复杂、鲨鱼特征捕捉不明确等问题,为使其可以

很好地适应海底鲨鱼图像,以获得效果可观的分

类性能,本研究使用改进的 ResNet 网络结构将初

始模型的特征提取器替换,以求更有效地捕捉鲨

鱼图像的深层特征,并引入 NAM 注意力机制来

进一步提升模型对鲨鱼图像关键特征的识别提

取,最后使用新颖 的 互 通 道 损 失 函 数 ( Mutual

Channel Loss)加强不同特征的语义关联性以提高

模型整体的分类性能[18]

。 本试验最终将改进后

的模型记为 DM-BCNN。

改进的模型网络框架如图 3 所示。

图 3 改进的 DM-BCNN 模型网络框架图

Fig. 3 Improved network diagram of DM-BCNN model

1. 4 模型改进

1. 4. 1 主干网络改进

由于 VGG 网络在双线性卷积神经网络中的

局限性,将原模型中双通道 A、B 使用的 VGG16

网络替换为改进的 DRAM_ResNet 网络。 该网络

具有更深的网络结构,并且在特征表示能力、训练

稳定性和速度上都具备更好的效果。 在此基础上

加入了有自适应形状采样的卷积操作,可以更好、

更灵活地识别复杂背景下鲨鱼的形体和关键特

征,对于捕捉鲨鱼图像上微小类别特征的能力有

了显著提升。

其中使用到的基准网络 ResNet 是计算机视

觉深度学习领域非常著名的模型之一。 多年来,

深度学习架构通过增加层数以适应更为复杂的任

务,这一趋势显著提升了分类与识别任务的性能,

增强了模型的鲁棒性[19]

。 在 ResNet 中残差块是

很重要的一个概念,残差网络中被称为“跳过连

接”的操作起着核心作用。 这种连接机制允许网

络直接传递信息,跳过某些层,残差块的结构图如

图 4 所示。

Y

)(Y)

relu

relu

weight layer

weight layer

identity

Y

图 4 残差块结构图

Fig. 4 Residual block structure diagram

93

第96页

渔 业 现 代 化 2024 年

具体来说,通过直接链接输入到输出,改变了

网络对信息的处理方式。 在传统的层级结构中,

输入 x 通过乘以层的权重并添加偏置项来转换。

而在引入跳过连接后,网络操作变为如下公式

(3)输出:

H(x) = f(x) + x (3)

ResNet 网络因其深层且有效的结构,在细粒

度分类中表现卓越[20]

。 残差连接解决了梯度消

失问题,使得网络能够有效地学习复杂特征,这对

区分微小类别差异至关重要。 此外,ResNet 具有

良好的泛化能力,适应样本多样性大且数量有限

的情况,使其在细粒度分类任务中具有显著优势,

对于鲨鱼种群细粒度分类具有良好的改进效果。

1. 4. 2 ResNet 改进

本研究将特征提取器从 VGG16 替换为新的

ResNet 网络后进行了新的改进,首先引入了名为

可变形卷积的新卷积核并对 ResNet 网络的卷积

层结构进行了适当的修改。

常规卷积的卷积核为固定的大小与形状,对

于形状规则的物体可能会有更好的效果,但遇到

形状多样不规则的物体时常规卷积效果则有所欠

缺。 可变形卷积的采样位置更符合物体本身的形

状和尺寸,相比标准卷积,它更加能够排除背景噪

声的干扰,得到更加有用的信息[21]

可变形卷积的原理是基于一个网络学习

offset 偏移量,使得卷积核在 input feature map 的

采样点发生偏移,集中于期望的区域或者目标。

对于输入特征图上任意一点 P0 ,可变形卷积的操

作如公式(4)所示:

y(P0 ) = ∑p

n∈R

W(pn )∗x(p0

+ pn

+ Δpn ) (4)

在图 5 中的 input feature map 上普通卷积操

作对应卷积采样区域是一个卷积核大小的正方形

绿框,而可变形卷积对应的卷积采样区域为一些

蓝框表示的点,图 5 中展现了可变形卷积与普通

卷积的区别。

在 此 ResNet 的 改 进 中 主 要 是 将 初 始

ResNet50 中 conv 模块内大小为 3×3 的卷积核替

换成卷积核大小同为 3×3 的可变形卷积,此卷积

操作可更好地捕捉输入图像中的非规则形状和局

部结构,且能对特征图进行更加精细的空间变换,

这对于细粒度分类中的局部特征提取非常有益。

可变形卷积与前后的标准卷积相连形成 conv -

dconv-conv 结构,简称 cdcConv,此结构首先通过

1×1 的标准卷积对大小为 64×56×56 的输入图像

的特征进行降维操作,紧接着使用 BN 操作使每

一层神经网络的输入保持相同分布。 cdcConv 的

结构如图 6 所示。

EFGPSNBCMF DPOWPMVUJPO

PVUQVU GFBUVSF NBQ JOQVU GFBUVSF NBQ

DPOW

/

PGGTFU GJFME

PGGTFUT

图 5 可变形卷积示意图

Fig. 5 Deformable convolution diagram

JOQVU

$POW f JO@D

PVU@D

$POW f PVU@D

PVU@D

#BUDI/PSN PVU@D

#BUDI/PSN PVU@D

#BUDI/PSN PVU@D

3F-6

PVU

%FGPSN$POW f PVU@D

PVU@D

TUSJEF

图 6 cdcConv 结构图

Fig. 6 Structure diagram of cdcConv

在特征映射之后,接入 3×3 的可变形卷积,

学习 2×3×3×56×56(2×K×K×H×W)个参数以使该

卷积核区域的每一个卷积采样点都学习一个偏离

量 offset 来进行可变形卷积操作,其中 K×K 为卷

积核大小,H×W 为输入图像尺寸。 由于可变形卷

94

第97页

第 5 期 蒋飞等:基于注意力机制的 DM-BCNN 鲨鱼种群细粒度分类方法

积具备允许卷积核在空间维度上动态调整形状,

以适应输入图像中的非线性形状和结构特征的特

点[22]

,所以在图像经过 1×1 的标准卷积和 3×3 的

可变形卷积后,可以有效扩大卷积操作的感受野

和上下文信息,并有助于提取更加丰富和具有区

分性的局部特征。 最后再通过 1×1 的标准卷积恢

复维度,执行 BN 和 RELU 操作。 可变形卷积和标

准卷积操作的结合能够使模型比改进前更好地理

解图像的全局结构和语义信息,解决了鲨鱼图像由

于背景颜色暗淡单一、背景环境复杂、鲨鱼形态不

规律导致的多个关键特征提取效果不佳的问题,以

提高模型对复杂环境的理解和分类准确率。

1. 4. 3 NAM 注意力机制

本研究使用改进的特征提取网络之后,改进的

模型对于鲨鱼图像的局部特征提取有了显著提升。

但由于鲨鱼图像不同种类间的细微差异难以捕捉,

导致其关键特征选择困难且语义信息理解略显不

足。 在此问题上引入了 NAM(Normalization-based

Attention Module)注意力机制[23]

。 该注意力机制

能够自适应地调整特征权重使网络更好地选取关

键特征,强化模型对关键信息的感知能力,并有助

于网络更深层次地理解并捕捉图像中重要的语义

特征。

NAM 注意力机制是通过保留输入的残差后

进行归一化,而后计算出归一化层权重的绝对值

与权重绝对值之和的比例,以此表示每个通道的

重要性。 最后,对特征图加权并与残差相乘使其

更加强调一些重要通道,抑制一些不重要通道,提

升对鲨鱼图像关键特征的提取能力。

其中此模块用到了通道注意力子模块,使用

批量归一化( BN) 的比例因子测量出信道的方

差[24]

,如公式(5)所示,此操作也指示其重要性。

Bout

= BN(Bin ) = γ

Bin

- μB

σ

2

B

+ ε

+ β (5)

式中:μB 和 σB 分别为小批 B 的均值和标准差;γ

和 β 是可训练的仿射变换参数;ε 是一个很小的

正数常量,防止除以零导致数值不稳定。 γ 为各

通道的标度因子,权重为 Wγ

=

γi

γ

j = 0

γj

。 通道注意力

子模块如图 7 所示,其中 MC 表示输出特征。

#/ XFJHIU

TJHNPJE

JOQVU GFBUVSFT '

图 7 NAM 通道注意力机制

Fig. 7 NAM channel attention mechanism

1. 4. 4 损失函数改进

在进一步解决了鲨鱼图像关键特征的识别和

提取问题后,由于双线性卷积神经网络在进行双

线性汇合操作时有丢失一些细微特征信息的风

险,这会导致融合后的特征不够全面或不够具有

区分性。 在此问题的基础上引入了互通道损失函

数来增强特征的融合和交互以及网络不同通道之

间的语义关联性,以此丰富鲨鱼图像多样性的特

征表示并使其能够更加全面地捕获图像中不同方

面的重要信息。

B-CNN 基础网络模型中使用的是交叉熵损

失函数,该损失函数在分类问题中常与 Softmax

函数标配。 Softmax 激活函数常用于多分类问题

中的输出层,它将一个含任意实数的向量,转换成

一个实数值在 0 到 1 之间的向量,并且转换后的

所有组成部分之和为 1,再通过交叉熵来计算损

失[25]

。 Softmax 函数如公式(6)所示:

Softmax(xi) =

e

x

i

j

e

x

j

(6)

交叉熵损失函数能够衡量同一个随机变量中

的两个不同概率分布的差异程度,在机器学习中

95

第98页

渔 业 现 代 化 2024 年

表示为真实概率分布与预测概率分布之间的差

异。 交叉熵的值越小,模型预测效果就越好[26]

对于多分类问题,每个类别都有一个预测概率,并

且真实标签通常使用独热编码,即每个类别对应

一个概率,正确类别为 1,其他为 0。 交叉熵损失

函数 H(P,Q)如下公式(7)所示。

H(P,Q) = - ∑

n

i = 1

P(xi)logQ(xi) (7)

但是,由于鲨鱼种群数据集中的样品存在噪

声和干扰,对异常值较为敏感的标准交叉熵损失

函数会受到一定程度上的影响,从而导致在训练

时模型过拟合,继而影响到模型分类时的精确率。

Chang 等[27]提出了一种基于两种组件混合作用

来判别特征的互通道损失函数 Mutual Channel

Loss(MC-Loss),这一损失函数将输出特征通道

作为输入,并使用超参数支持与交叉熵(CE)损失

函数集合在一起,解决了模型由于数据集噪声对

一些关键特征区域关注度不够且不同通道语义关

联性不足的问题,MC-Loss 可以有效地导航模型,

聚焦于不同的区分区域,且不需要任何细粒度的

限定框或部件注释。

首先,令模型所提取的特征图为 F,交叉熵流

将 F 视为具有传统 CE 损失 LCE 的全连接(FC)层

的输入。 在此,交叉熵损失促使网络提取一些有

利于全局目标类别的判别特征。 其次,MC-Loss

流监控网络以关注不同局部判别块的特征,然后

在训练时将 MC-Loss 加上 CE-Loss,并以支点的

权重加入到 CE-loss 中。 因此,可以将整个网络

的总损耗函数定义为如下公式(8)所示:

Loss(F) = LCE(F) + μ × LMC(F) (8)

此外,MC-Loss 是一个判别分量 Ldis 和另一

个多样性分量 Ldiv 的加权和,它通过判别性组件

使一个类别的多个通道尽可能学习该类别最有判

别性的特征,通过多样性组件使各通道关注图像

的不同区域。 可以将 MC-Loss 定义为如下公式

(9)所示:

LMC(F) = Ldis(F) - λ × Ldiv(F) (9)

本研究提出的 DM-BCNN 鲨鱼种群细粒度分

类模型中,对互通道损失函数 MC-Loss 中的超参

数 μ 做出了以下的研究:当 0 <μ < 10 时,权重过

小,不利于模型的结果提升;当 μ>10 时,模型结

果略提升之后趋于平缓;当 μ = 10 并通过了试验

验证,此时的超参数值最适合本试验中的鲨鱼种

群细粒度分类模型且结果达到最佳。

1. 5 学习策略

本研究使用的学习策略为迁移学习。 迁移学

习是一种机器学习方法,它涉及从一个任务中学到

的知识应用到另一个不同但相关的任务中[28]

。 这

种方法特别适用于数据不足的情况,它可以利用在

数据丰富的任务上获得的知识来弥补另一模型数

据量不足的问题[29]

。 本研究由于鲨鱼细粒度分类

图像 数 据 量 不 够 巨 大, 因 此 采 用 大 型 数 据 集

Imagenet 上预训练的 ResNet 深度学习模型作为起

点,并且为了更好地适应特定的细粒度任务,对预

训练模型的一些层进行微调以此调整和优化权重,

同时也对双线性卷积神经网络模型进行一些结构

上的改进,使此研究的模型可以得到更好的结果。

1. 6 试验环境配置

本研究试验平台为 Windows10,64 位操作系

统, 服 务 器 配 置 中 的 GPU 为 NVIDIA GeForce

RTX 3060, 内 存 为 8GB。 CPU 为 i7 - 11800H,

2. 3 GHz,内存为 16 GB。 使用的模型在 Anaconda

搭建的环境中运行,编程环境为 Python 3. 8,环境

框架为 PyTorch。

1. 7 试验参数及评价标准

本试验模型训练的 epoch 迭代次数均为 200

次,根据每轮批次的图片数量,设置 batch_size 为

32,初始学习率为 1×10

-4

,动量因子为 0. 9,优化

方法为 SGD,损失函数为互通道(Mutual Channel)

损失函数。

选取 Top - 1 准 确 率 ( Accuracy )、 精 确 率

(Precision)、召回率(Recall)和 F1 分数作为评价

指标来衡量模型在细粒度图像分类上的效果。

这些指标有助于全面评估图像分类模型的性

能。 Top-1 准确率是衡量模型在数据集中正确预

测类别的比例,精确率是评估模型在预测为正类

别的样本中真正为正类别的比例,召回率是度量

模型成功预测实际正类别样本的比例,F1 分数是

综合考虑了精确率和召回率的调和平均值[30]

,为

评估模型性能提供了全面的指标。

2 试验结果

2. 1 不同网络和本研究方法的对比试验

为验证本研究方法在鲨鱼图像细粒度分类上

的性能,将本研究的 DM-BCNN 算法和不同深度卷

96

第99页

第 5 期 蒋飞等:基于注意力机制的 DM-BCNN 鲨鱼种群细粒度分类方法

积神 经 网 络 进 行 对 比 试 验, 即 DM - BCNN 与

Vgg19、ResNet50、SwinTransformer_v2 和 EfficientNet

_v2 这 4 种网络模型进行对比。 DM-BCNN 在原

始权重上施加初始化策略并采用特定的优化算法

及损失函数进行端到端的迭代训练[31]

,其他 4 种

网络采用迁移学习方法进行训练。 各模型在验证

集上的准确率和损失值变化如图 8 所示。 由图

8a、b 可以看出,对比试验中 5 种模型的准确率在

验证集上稳定增长、验证损失精度在训练过程中

逐步降低,未有较大的振荡。 以此选取在验证集

上准确率最高的模型为最终模型,模型分类性能

评估的对比结果如表 2 所示。





ffi













B

ffifl 

C

ffifl

 





图 8 不同网络在验证集上的试验过程

Fig. 8 The experimental process of different networks on verification sets

表 2 不同网络和本研究方法对比的试验结果

Tab. 2 The experimental results are compared between different

networks and the proposed method

模型

TOP1

准确率/

%

精确

度/ %

召回

率/ %

F1

分数/

%

Vgg19 84. 71 85. 50 84. 61 84. 72

ResNet50 87. 67 87. 56 87. 61 87. 98

SwinTransformer_v2 92. 05 92. 38 92. 12 92. 16

EfficientNet_v2 93. 26 94. 85 93. 18 93. 32

DM-BCNN(本研究方法) 96. 12 96. 07 96. 19 96. 26

2. 2 消融试验

本节从双线性卷积神经网络模型中特征提取

网络、注意力机制和损失函数这三方面来进行消

融试验,以此验证本试验改进对于该模型在细粒

度分类上识别效果的影响。 双线性模型 B-CNN

由两个基于 VGG16 的特征提取器组成,现本试验

将替换为以引入可变形卷积的 ResNet 为特征提

取器的 BCNN 模型记为 DR_BCNN,继特征提取

器的改进后,将加入 NAM 注意力机制的新模型

记为 DRAM_BCNN,最后将替换为互通道损失函

97

第100页

渔 业 现 代 化 2024 年

数的新模型记为 DM-BCNN。

4 种改进的模型进行消融试验的结果如表 3

所示。

表 3 消融试验结果

Tab. 3 Ablation results

模型

Top1 准确

率/ %

精确度/

%

召回率/

%

F1 分数/

%

B-CNN 93. 61 93. 54 93. 70 93. 74

DR_BCNN 94. 46 94. 91 94. 62 94. 64

DRAM_BCNN 95. 87 95. 82 95. 68 95. 79

DM-BCNN 96. 12 96. 07 96. 19 96. 26

3 讨论

3. 1 对比试验分析

由表 2 可知,对比表 2 中其他 4 种模型,本研

究的 DM-BCNN 模型在准确率、精确度、召回率和

F1 分数 4 项评价指标上都优于其他 4 种网络模

型。 DM-BCNN 的 Top-1 准确率相比于 Vgg19、

ResNet50、SwinTransformer _ v2、EfficientNet _ v2 分

别提升了 11. 41 个百分点、8. 45 个百分点、4. 07

个百分点、2. 86 个百分点。 从以上数据可以看

出,相比于其他 4 种模型,本研究的 DM-BCNN 模

型更加适用于细粒度图像分类,其在分类准确率

和训练收敛速度上都有了更进一步的提升。 由此

说明,利用新的特征提取器、注意力机制和 MCLoss 解决细粒度图像特征不明显以及关键特征信

息难以获取分析的问题,可有效提升模型的分类

准确率。

3. 2 消融试验分析

表 3 说明,由于将初始模型中的特征提取器

替换为更高效的新提取器,使得模型在卷积操作

中可以更灵活地捕捉图像中非规则的形状和局部

结构的同时,也能提升特征的表示能力,使得 DR

_BCNN 在 Top-1 准确率上相比初始模型 B-CNN

提升了 0. 85 个百分点。 在引入 NAM 注意力机制

后,解决了图像关键特征获取不准确的问题,使

DRAM_BCNN 相比初始模型 B-CNN 提升了 2. 26

个百分点,在最后将原损失函数替换为互通道损

失函数后,加强了网络不同通道间的语义关联性,

使得最终的改进模型 DM-BCNN 相比于初始模型

提升了 2. 51 个百分点。 且最终模型 DM-BCNN

的精确度、召回率和 F1 分数相较于初始模型也分

别提升了 2. 53 个百分点、2. 49 个百分点和 2. 52

个百分点。 以上改进促进了评估指标的提升,验

证了本试验的方法是可行有效的。

3. 3 对比讨论

3. 3. 1 分类对象

对比观赏斗鱼的分类[32]

,本研究难点之一在

于鲨鱼种群细粒度图像分类的复杂、多变等问题

上。 由于鲨鱼处于较深的水下环境,可见度低、生

存环境背景复杂,导致拍摄的鲨鱼图像部分特征

难以提取识别,使得常规模型对于鲨鱼的特征提

取准确率低。 对于海洋岩礁生物分类[33]

,不同的

鲨鱼种群在水下有更加灵活多变的体态,这对于

大多使用标准卷积来实现目标识别分类的模型来

说,在鲨鱼种群细粒度分类上的效果不是非常理

想。 相比鲤鱼分类[34]其种类间形态、颜色和鳞片

等特征差异大更易识别,鲨鱼不同种类特征类内

差别小,具有类似的鳍形状和体型,使鲨鱼种类间

更加难以区分。 相比淡水鱼分类[35] 中对象的活

动体态稳定、姿态变化少,鲨鱼分类中动态特征多

且由于很多细微特征在不同活动下会产生变化,

导致特征不稳定使得常规分类模型更难捕捉特征

和区分种类。 针对以上鲨鱼细粒度分类存在的难

点,改进的 DM-BCNN 网络模型引入了可变形卷

积、cdcConv 结构加强了鲨鱼图像局部特征的提

取能力以及鲨鱼多变体态的自适应识别能力,有

效提升了鲨鱼种群在细粒度图像分类上的准

确率。

3. 3. 2 分类算法

对比改进 Transformer 的细粒度分类[36]

,其算

法能去除一些冗余特征信息,更有效地提取局部

特征,但该算法存在特征选择模块的潜在信息损

失问题,可能误删一些细粒度分类中至关重要但

表现细微的关键特征信息,导致图像关键特征的

识别捕捉能力不足。 对比结合注意力互斥正则算

法下的细粒度分类[37]

,该算法以 ResNet50 为主

干网络通过互斥正则机制引导模型关注图像的不

同区域,但由于注重判别局部特征忽略了全局的

特征表示[38]

,使得模型对全局各特征间的提取关

联性较差。 对比改进 VGG 网络的污水生物分

类[39]

,此算法可重新校正特征图的通道权重,加

强模型对有用信息的捕捉能力,但该算法区分高

98

百万用户使用云展网进行电子翻书制作,只要您有文档,即可一键上传,自动生成链接和二维码(独立电子书),支持分享到微信和网站!
收藏
转发
下载
免费制作
其他案例
更多案例
免费制作
x
{{item.desc}}
下载
{{item.title}}
{{toast}}