视觉系统设计VisionSystems China
2025年机器视觉产品 8市场将上升
SWaP-C原则实现低成 15本高清热成像相机
方形、圆顶两种无影 23 光源的应用比较
MWIR高光谱成像应对32黑色塑料污染难题
深度学习技术赋能机器视觉应用 18
2025成都国际工业博览会CDIIF成都国际工业博览会 Chengdu International Industrial Fair 2025
2025.4.23-25丨中国西部国际博览城


|主办单位
Shanghai Industry&DEXPO Commerce Exhibition Co., Ltd.东浩兰生会展DONGHAOLANSHENGEXPO 上海工业商务展览有限公司

2025.9.23-27国家会展中心(上海)

华南国际工业博览会SCIIFSouth China International IndustryFair中国机博会暨武汉工博会CWME&WIIF

2025年6月4日-6日深圳国际会展中心(宝安)www.sciif.com
2025年10月15日-18日武汉国际博览中心cwme.forgood.net
参展咨询请联系:树悦 电话:021-63811020 邮箱:yshu@shanghaiexpogroup.com参观咨询请联系:李凌娴电话:021-63811733 邮箱:Ixli@shanghaiexpogroup.com

国际知名媒体授权报道全球高新科技信息

服务于机器视觉设计、电子制造、激光/光电子、射频/微波、化合物半导体半导体制造、洁净及污染控制、电磁兼容等领域的专业读者及与会者

市场风向标 MARKET TRENDS
8 美国自动化促进协会A3预测:2025年机器视觉产品销售将上升
A3 Predicts Uptick in Automation and Machine Vision Sales in 2025
10 色选机开启安徽视觉产业发展新篇章
Color Sorter Ushers in a New Era for Anhui's Vision
Industry Development
作者:安徽省视觉技术协会
技术趋势 TECHNOLOGY TRENDS
15 SWaP-C 原则实现低成本高清热成像相机SWaP-C Principles Enable Inexpensive High-Definition Thermal Imaging Cameras作者:艾迈斯欧司朗
18 深度学习在机器视觉中的作用及应用
Deep Learning: Its Proper Role and Use in Machine
Vision
作者:斑马技术
23 方形、圆顶两种无影光源的应用比较
Square vs. Dome-Shaped Shadowless Light Sources: A Comparative Analysis in Machine Vision Applications 作者:东莞乐视自动化科技有限公司
25 为机器视觉应用选择合适的 SWIR 传感器Choosing a SWIR Sensor for Machine VisionApplications作者:Cory Boone,Nicholas Sischka公司
27 ADAS 系统中的传感器创新在道路交通中挽救生命Sensor Innovations in ADAS Systems Play Key Rolein Road Safety作者:Bahman Hadji,安森美汽车感知事业部产品营销高级经理
应用与解决方案 APPLICATIONS & SOLUTIONS
31 机器视觉系统检测鳕鱼片中的寄生虫
Machine Vision Inspection System Detects Parasites in Cod 作者:Linda Wilson
32 中波红外高光谱成像技术应对黑色塑料污染难题Using MWIR Hyperspectral Imaging to Battle Black PlasticPollution作者:Minna Törmälä,Specim公司
35 视觉引导的机器人实现柔软鱼片的自动化整形
Vision-Guided Robot Shapes Breaded Fish into Uniform Filets 作者:Linda Wilson

编者语 UP FRONT
41 AI大模型:开启智能制造新纪元 AI Big Model: Opening a New Era of Intelligent Manufacturing
专题/ FEATURE 机器人/ROBOTS
42 AI大模型迈向多模态,助力具身智能与机器人实现创新 AI Big Models Towards Multimodality for Embodied Intelligence and Robotics to Enable Innovation 作者:马健 Arm 物联网事业部业务拓展副总裁 负责人
44 工厂里的机器人: 支持 5G 的 AMR 如何提高效率Robots in the Factory: How 5G-Enabled AMRs can BoostEfficiency作者:Embedded Computing Design 编辑部
46 增强自主移动机器人的安全性
关于《视觉系统设计》
《视觉系统设计》杂志是全球机器视觉领域知名的英文刊物《Vision Systems Design》杂志的中文版,在内容方面以《Vision System Design》为蓝本,同时也涵盖国内市场信息,致力于报道国内外机器视觉技术的最新发展及在各个行业的应用情况,尤其关注在工业智能制造领域的应用。随着AI技术在工业制造领域的应用不断拓展,特别是与机器视觉的深入融合,自2025年起,《视觉系统设计》杂志特增加《工业AI》版块,报道AI技术在工业制造中的实际落地应用情况,旨在引进国外先进技术与推进国内技术创新,服务中国工业转型升级,促进新质生产力发展,打造中国领先的技术交流平台。
《视觉系统设计》创刊于2013年,以双月刊出版,目前注册读者超过31,000名。此外《视觉系统设计》每年还参加国内外相关重大展会, 面向专业读者免费派发,增加发行覆盖。网站:www.vision-systems-china.com。
About Vision Systems Design China
Vision Systems Design China (VSDC) is the Chinese version of Vision Systems Design (VSD), a well-known media brand focused on machine vision worldwide. Content of VSDC is partially selected from VSD, also covers China domestic market information, reporting on the latest developments and applications of machine vision technologies in various industries, especially in the field of industrial intelligent manufacturing. With the continuous expansion of AI in industrial manufacturing, especially the deep integration with machine vision, the "AI in Manufacturing" section will be added to the VSDC magazine to report on the actual deployments and applications of AI in industrial manufacturing starting from 2025,intending to introduce overseas advanced technologies and push China domestic technology innovations, serve China's industrial transformation and upgrading, promote the development of new quality productivity, and build a leading technology exchange platform in China.
VSDC magazine was founded in 2013 and is published bimonthly with over 31,000 registered readers. In addition, VSDC also participates in major domestic and international exhibitions every year, distributing free of charge to professional readers to increase distribution coverage. Please visit our website, www.vision-systems-china.com.
视觉系统设计VisionSystems ChinaDESIGN
Feb / Mar 2025 目录 CONTENTS
技术荟萃 TECHNICAL CLUSTER
48 微软如何利用动态少镜头技术优化 NLP 模型How Microsoft Is Optimizing NLP Models With Dynamic Few-ShotTechniques作者:Eleanor Hecks Designerly 杂志主编
FPGA和数据溯源保障AI安全
FPGA and Data Traceability for AI Security
Lattice公司供稿
51 新推理框架在不增加成本的情况下加快大型语言模型的进度New Inference Framework Speeds up LLMs Without Raising Costs作者:Eleanor Hecks Designerly 杂志主编
52 利用AI增强OT对现代网络威胁的防御Using AI to Enhance OT Defences Against Modern Cyber Threats作者:Navneet Singh 派拓网络网络安全市场副总裁
53 为何使用模块消除网络拥塞
Why Use a Module to Eliminate Network Congestion作者:Andrew Hart Infineon 公司产品管理总监Steffan Berggen U-Blox高级产品营销经理
应用案例 APPLICATION NOTES
56 制造业中的物联网: 使用案例、优势和挑战IoT in Manufacturing: Use Cases, Benefits, and Challenges作者:Pritesh Patel Azilen 科技公司
59 利用 FPGA 技术革新视觉人工智能应用Revolutionizing Vision AI Applications with FPGA Technology作者:Embedded Computing Design 编辑部
4 编者话 Editor's Notes
5 前沿简讯 Leading Edge Snapshots
37 产品撷英 Products Highlights
60 广告索引 Ad Index
关于雅时国际商讯 (ACT International)
ACI 《时国际传媒集团成立于1998年,在高增长的中国市场上为众多高科技领域提供服务。通过其产品系列,包括印刷和数字媒体以及会议和活动,雅时国际为国际营销公司和本地企业提供了进入中国市场的机会。雅时国际的媒体品牌为电子制造、机器视觉系统、激光/光子学、射频/微波系统设计、洁净室/污染控制和半导体制造, 化合物半导体, 工业AI等领域的20多万名专业读者和受众提供服务,雅时国际也是一些世界领先的技术出版社和活动组织者的销售代表。雅时国际的总部设在香港,在北京、上海、深圳和武汉设有分公司。www.actintl.com.hk
About ACT International Media Group
ACT International, established 1998, serves a wide range of high technology sectors in the high-growth China market. Through its range of products -- including magazines and online publishing, training, conferences and events -- ACT delivers proven access to the China market for international marketing companies and local enterprises. ACT's portfolio includes multiple technical magazine titles and related websites plus a range of conferences serving more than 200,000 professional readers and audiences in fields of electronic manufacturing, machine vision system design, laser/photonics, RF/microwave, cleanroom and contamination control, compound semiconductor, semiconductor manufacturing and AI in Manufacturing. ACT International is also the sales representative for a number of world leading technical publishers and event organizers. ACT is headquartered in Hong Kong and operates liaison offices in Beijing, Shanghai, Shenzhen and Wuhan. www.actintl.com.hk
4000系列智能3D同轴线共焦传感器出色的兼容角度 扫描多功能性最大化




提前做好准备迎接经济好转
虽然2024 年包括机器视觉在内的整个自动化行业都普遍表现不佳,销售额接连下滑,然而对于2025 年,人们心中依然怀有乐观预期,年初本刊对国内十余位机器视觉行业资深从业者的采访,也显示了对市场回暖的信心。
国际市场方面,在美国自动化促进协会(A3)于2025 年1 月下旬举办的年度商业论坛上,经济专家Alan Beaulieu 表示,“2025 年经济形势将会好转,20 上半年将出现缓慢但积极的变化,下半年向好的速度会更快,2026 年经济将迎来真正提速,并在接下来的十年更加繁荣。(p8)”在行业持续低迷、市场阴云密布的时刻,这一预测宛如一股强心剂,驱散了笼罩在人们心头的阴霾,让人们看到了暗淡之后的曙光高照,重燃对行业发展的希望与信心。
经济形势的好转将推动自动化行业销售额的增长,特别是其中的机器视觉组件和系统,将在物流、半导体、医疗保健、生命科学、制药、农业、建筑业等行业迎来销售增长;劳动力短缺、人口老龄化、各国发展半导体产业的战略部署,将共同推动对机器视觉应用需求的增长。
深度学习正在让机器视觉功能更强大且更易实现,但其在机器视觉应用中的部署也面临挑战。一方面,它在高精度定位、精确测量等任务上存在局限;另一方面,深度学习需要精心准备和维护,涵盖数据的收集、标注、划分数据集,训练时调整超参数,训练后评估模型。深度学习是对经典机器视觉软件的补充,Zebra 的深度学习工具及 Aurora 软件为用户应对复杂挑战、构建定制解决方案提供有利支持(p18)。
这也表明软件在机器视觉系统中已越来越占据核心地位。随着制造工艺的不断提升,机器视觉不同品牌在硬件方面的差距已经不大,而软件实现将是真正能够拉开差异化的关键所在。在软件层面,尤其是核心算法与平台开发方面,国产品牌仍落后于行业国际巨头。这种差距的根源可能涉及技术积累、产业生态、人才培养等多重因素。在即将迎来经济好转的当下,希望国产品牌能潜心在软件方面有所突破,比如从“补短板”转向“筑长板”,通过垂直场景深耕、生态协同、人才储备等策略,逐步缩小与国外巨头的差距,待市场回暖以把握更多商机。
本期内容中,还包括了安徽视觉产业发展历程(p10)、低成本高清热成像相机(p15)、方形和圆顶无影光源在机器视觉应用中的优劣比较(p23)、如何为机器视觉应用选择合适的 SWIR 传感器(p25)、 中波红外高光谱成像技术对解决黑色塑料污染问题的帮助(p32)等内容,供读者参考。
主编:庞会荣
视觉系统设计 工业AIVisionSystems China AI IN MANUFACTURING
出版社 Publishing House地址 Address雅时国际商讯 ACT International香港九龙 Unit B, 13/F, Por Yen Building,长沙湾青山道478号 No.478 Castle Peak Road,百欣大厦 Cheung Sha Wan,13楼B室 Kowloon, Hong Kong.电话 852 2838 6298传真 852 2838 2766
出版总监 Publishing Director麦协林 Adonis Mak电邮 adonism@actintl.com.hk社长 Publisher姚丽莹 Hatter Yao电邮 hattery@actintl.com.hk
中文版主编 Editor - China庞会荣 Rossie Pang电邮 rossiep@actintl.com.hk
编辑/记者 Editor & Reporter张青勉 Vicky Zhang电邮 vickyz@actintl.com.hk张辉 Denny Zhang电邮 dennyz@actintl.com.hk
编委会 ( 排名不分先后)
蔡振荣 香港应用科技研究院安平 上海大学
周文举 上海大学
刘暾东 厦门大学
王世刚 吉林大学
张建州 四川大学
竺长安 中国科学技术大学
孙国栋 湖北工业大学
AIM 编辑 AIM Editor 黄莺 Katie Huang 电邮 katieh@actintl.com.hk
AIM 编委会成员 ( 排名不分先后)崔 斌 蔡振荣 戴高敏丁险峰 范丛明 黄晓园苏锐丹 史 喆
免费赠阅咨询
电话 86 755 2598 8573/8567
传真 86 755 2598 8567
电邮 circulation@actintl.com.hk
网址 www.vision-systems-china.com
美国办公室 US office VisionSystems ENDEAVOR Peter Fretty Associate Group Publisher (English edition) (231) 329-2739 pfretty@endeavorb2b.com Linda Wilson Editor in Chief (English edition) (941) 200-3345 lwilson@endeavorb2b.com
⊚ 2025 版权所有 翻印必究
前沿简讯 Leading Edge Snapshots
迁移科技 \mathsf{A l}+3\mathsf{D} 视觉,提升金属加工生产效率和质量
在金属加工行业中,管件的上料环节是生产流程中的关键步骤。传统的人工操作模式面临诸多挑战,具体表现在人工分拣和上料速度慢、金属管件表面高亮反光难以精准识别和定位、传统设备难以快速适应多品种、小批量中生产中不同规格的管件、人工操作操作失误等方面。
某金属加工企业在生产中需要处理17 种不同规格的金属管件,这些管件具有高亮反光、紧密堆叠等特点。迁移科技为其定制了一套基于 AI{+}3D 视觉的自动化解决方案,在自动化上料方面用机械臂实现金属管件的自动抓取和上料,在高精度识别方面解决了高亮反光金属件的识别难题,在快速适配方面能够快速适应新增的管件规格,还通过自动化改造,显著提高产线的生产效率和良品率。

迁移科技的解决方案配置了高精度3D 视觉系统,采用迁移科技自主研发的Epic Eye Laser L 工业级激光3D 相机,能够以 ± 0.5mm 超高识别精度扫描高亮反光金属管件,生成高质量点云数据,确保精准识别和定位;应用AI 智能抓取算法,系统能够智能规划机械臂的最优抓取路径,有效避免紧密堆叠管件之间的碰撞,确保抓取过程稳定可靠;系统支持17 种不同规格的金属管件,并能在1 小时内快速适配新增的管件规格;系统与发那科机械臂无缝集成,实现从管件识别、抓取到上料的全流程自动化,大幅提升生产效率。
Coaxlink系列
COAXPRESS图象采集卡,极致性能,卓越价值 ATAGLANCE
PCle图像采集卡,多达8路CoaXPress连接
特征丰富的多达20条数字1/0线
丰富的相机控制功能
Memento事件日志工具
铜缆或光纤连接
Grablink系列
CAMERALINK图像采集卡 ATAGLANCE
适用于Camera Link 80位Full、Medium、Base、
Lite配置相机的PCle采集卡
直接兼容市场上数以百计的CameraLink相机
ECCO+/ECCO:CameraLink电缆延长
特征丰富的数字I/0线
Memento事件日志工具
海康叉取机器人突破托盘局限,实现不同场景下的高效搬运
海康机器人F4 系列叉取机器人,大幅拓宽了搬运对象与场景覆盖范围。它能搬运多种高度、形态各异的物料,突破了传统叉车单一料框搬运局限,成为不同场景下高效搬运的多面手。
在圆形物料搬运方面,依据直径的大小、表面硬度、用户的业务搬运及存储需求,F4 车型可以变形常规叉齿、楔形叉齿、托举块、调距圆棒,完成不同的设备对接与物料搬运。
在退火框夹取搬运方面,非标料框的搬运也不在话下,基于F4 车体基座,从退火输送线到提升机再到线边台,可顺利交换,利用超薄车体优势,双通道规划, 2200mm 取放通道规划,解放工厂长距离搬运的劳动力。
在铝锭和锌锭搬运方面,可以根据物料规格的变化,设计与之相匹配的叉齿形状,从而顺利完成铝锭及锌锭从打包线到存储区的搬运,与传统运载工具相比,运行通道可缩小 40% ,库容增加 30% 。
在超宽料架搬运方面,基于F4 车体执行能力,兼容1.5T~3T ,叉齿可调整尺寸,适配不同料架搬运,支持线边缓存搬运、设备对接、驶入式货架和横梁式货架区存储等,叉取通道空间缩减了 40% 。
在超窄载具搬运方面,针对小料架大载重,基于F4车型变形单臂叉齿,适应小载具进叉孔和平面载具,满足带轮载具缓存,平面载具对接等应用。针对非标长载具,匹配变形单臂叉齿,适应长载具提升对接业务的场景。

在不锈钢料筒搬运方面,对洁净度要求极高的行业,通过增加不锈钢包边、外壳和风琴护罩,满足GMP 要求,无缝对接锥形投料站、压片机、提升机和立库输送线,保障生产环境的洁净与安全。
F4 系列叉取机器人,在重量方面能够满足1000~3000kg 的负载需求;在高度方面,可覆盖 1.3~6m 的提升需求,其车体厚度经过量身设计,极大地减少了方案运行时的通道宽度,从而提升了物料存储空间,适用于汽车、锂电、印刷、快消、制药等行业。
辛米尔自带AI 算法的相机监测规定操作过程
某公司的打印机业务是由其代工厂生产,对品质有着严格要求。在实际操作中,若要掌握所有工人操作的每个动作是非常耗时且困难的。即使工厂已经明确了标准作业程序,但在无人监测的情况下,厂方仍无法确保作业员按标准执行,缺乏检测违规作业的有效手段,且无法有效记录和可视化还原所有问题作业的操作数据。

自带AI 算法的辛米尔相机。若有漏步骤、作业手法错误、使用不正确的工具等违规操作,即时发出报警提醒操作人员,以减少人为错误。重点检测墨水槽组装工站,检测作业员是否漏放弹簧、漏锁螺丝,是否进行冶具正确测试等规范操作,还要重点检测齿轮模组组装工站,检测作业员是否进行涂油脂、用治具去按压卡扣规范操作。
发生异常作业时,会触发即时报警,相机端会自动保存报警前后的短视频,供现场人员快速追溯缘由。每日所有的报警统计数据也会实时对接企业MES 系统,即使不在生产现场也能随时掌握一手生产资料,实现可视化追溯。
该工厂采用AI 视觉方案后,有效规范了作业人员的违规操作,产品良率得到了极大的提升,有效杜绝不规范产品流入市场。自动记录并保存的组装过程中的异常动作,为品质管理部门的回溯和问题定位提供便利。
康耐视VisionPro 软件助力锂电检测效率提升
面对锂电缺陷检测复杂度高、质量要求严苛等挑战,孚能科技通过部署康耐视VisionPro 智能视觉软件,突破传统检测技术局限,最终实现漏检率 {<}1% 。
孚能科技在实际生产中遇到了诸多挑战,例如电池检测项目繁多又复杂,对相机和系统配合要求高,还有电池瑕疵的外形、大小随机,仅依靠瑕疵大小和亮度判断,容易出现检测误判。
VisionPro 集定位、检测、识别、测量等功能于一体,可自动化、简化复杂且具挑战性的检测应用,不仅能够满足孚能科技的生产检测需求,解决了复杂的检测问题,而且部署和操作都简单高效。特别是在瑕疵检测方面,VisionPro 增加了对瑕疵微粒的对比度、亮暗颗粒比例及颗粒总数的分析,从而提高了检测的针对性和准确率。此外,VisionPro 还具有存储和查看错误对应图像、人机交互参数设置、设定参数修改权限等优异功能,极大地方便了使用和系统维护。通过VisionPro QuickBuild 快速原型设计环境,孚能科技的工程师们将高级编程的先进性和灵活性与易于开发性相结合,大大缩短了项目实施周期。

孚能科技在其生产基地的3 条电芯模组生产线,每条部署约40 台康耐视智能相机,由VisionPro 软件控制执行外观、尺寸检测及设备定位。集成后的康耐视检测系统实现了在线即时检测,并最终取得了以下的显著成效:VisionPro 软件编写的检测程序可轻松根据照片性质,自行判断并选取相应的检测方法,实现不良品自动剔除;增加对瑕疵微粒本身对比度、亮暗颗粒比例及颗粒总数分析,提高针对性和判断准确率;检测系统稳定运行两年多,实现漏检率 {<}1% 。
Baumer Passion for Sensors
堡盟 CX.SWIR.XC 主动冷却相机
短波红外波段范围内的极限精度
1400{-}1700\;\mathsf{n m} 的可见光和不可见光波段范围
专利保护的内嵌式传感器散热片, 最小化坏像素和暗电流
集成静态与动态相结合的坏像素校正, 确保出色的图像质量
像素漂移低, 确保纳米或微米级精度的穿透对位和检测

美国自动化促进协会A3 预测 :2025 年机器视觉产品销售将上升
2024 年,对包括机器视觉在内的自动化行业而言是令人失望的一年,销量不佳。
不过A3的成员预计 2025 年情况会有所好转。
作者:Linda Wilson
2025 年1 月下旬,美国自动化促进协会(Association for AdvancingAutomation,以下简称A3)在佛罗里达州奥兰多市为其成员举办了年度商业论坛,来自机器视觉、机器人技术、运动控制和人工智能(AI)等领域的700 多人参加了此次论坛。
论坛中展示的A3 相关数据显示(见图1),2024 年北美地区机器视觉组件和系统的销售额为28.63 亿美元,相较于2023 年的28.95 亿美元下降了 1% ;而2023 年的28.95 亿美元相较于2022 年的31.16 亿美元则下降了 7% ,呈现出连续下滑趋势。这种下滑趋势,是在后疫情时代才出现的。在此之前,2022 年的销售额为31.16亿美元,较2021 年的30.19 亿美元有所增长。

但论坛中也提出,近年的下滑趋势将有所改变,2025 年的机器视觉行业前景乐观,尤其在下半年将迎来销量的明显上升。
机器视觉市场情况
软件产品是2024 年机器视觉市场的最大亮点,与2023 年相比,其销售额增长了 14.5% 。但是,相机制造商的业绩则不如软件同行,销售额下降了 9% 。A3 执行副总裁AlexShikany 对此作了解释,他说,虽然相机销售额在后疫情时代曾因半导体芯片短缺一度出现增长,但是“此前提前囤货形成的库存积压,使2024年相机销售变得非常艰难”。
与2023 年相比,其他组件类别2024 年的销售额也有所下降:光源下降了 2.5% ,光学元器件下降了 4.6% ,成像板卡下降了 8% 。
系统类产品的销售情况优于组件类产品。A3 追踪的最大类别——特定应用系统的销售额,2024 年与2023 年相比下降了 0.7% ,而智能相机类别的销售额则增长了 1% 。
2025年自动化行业销售额将增长
论坛的主旨发言人、美国ITREconomics 公司的经济专家兼负责人Alan Beaulieu 称,据ITR Economics公司预测,2025 年经济形势将会好转,具体表现为2025 年上半年将出现缓慢但积极的变化,下半年向好的速度会更快。Beaulieu 还表示,经济将在“2026 年真正提速”,并在接下来的十年更加繁荣。同时,他也强调,此种情况将推动自动化行业销售额的增长。

Shikany 表示,他与Beaulieu 的观点一致,A3 也预计2025 年自动化市场前景更好,特别是其中的机器视觉组件和系统的销售情况也是如此。
机器视觉公司存在直接商业机会的行业包括:
• 物流行业
“机器视觉将在扫描、库存管理和物料搬运应用中发挥重要作用”,Shikany 说。
• 半导体行业
Fiber Optic cOmpOnentS, Line Scan ecta mTreeran SdysSt市em场S, a风nd 向La标SerS FOr reSearch and machine ViSiOn
由于美国出台了《芯片与科学法案》,在此背景下,众多企业在美国投资新建工厂。Shikany 评论道:“该法案的诸多价值尚待实现。由于各种原因,这些工厂仍处于最后的规划阶段或正在建设。它们需要部署技术和设备,而我们这个行业能够为它们提供帮助。”
• 医疗保健、生命科学、制药行业
人口老龄化推动了消费者对这些行业需求的增加,为了更好地满足这些需求,实现自动化即成为颇具吸引力的应对策略。Shikany 表示:“我们提供的价值主张对这些行业的公司极具吸引力。在他们需要生产、加工制造、销售更多产品时,我们都可以提供帮助。”
• 农业、建筑业
农业、建筑业都面临劳动力短缺问题,并且有大量工作不仅对体力要求高,还存在一定危险性。Shikany认为,从长远来看,机器视觉技术将会在这两个行业的自动化任务中,催生出越来越多的创新应用。
他说,风险投资已经在为建筑领域新兴的自动化解决方案提供资金。他还抛出几个反问引人思考:“难道要让人们绑在危险的滑轮系统上,在数百层楼高的地方进行人工操作?还是采用自动化解决方案?用机器人?用视觉系统?还是用无人机?”
通过自动化,人类可以通过在地面控制人机界面来监督高空作业。Shikany 补充道:“这些是我们看到的创新应用,如果这些价值主张引起共鸣,并认可投资回报率,它们可能会被广泛采用。”
A3的销售预期
A3 定期对从事自动化行业的成员进行调查。在这些调查中,A3 会询问成员对未来六个月以及全年自动化行业销售情况的预期。A3 于2025年1 月完成了最新调查,Shikany 向论坛与会者分享了调查结果。

与2024 年上半年销售情况相比,绝大多数受访者持乐观态度,预计2025 年销售额将增长,具体调查结果如下: 48% 的受访者预计将有适度增长( \overset{*}{\underset{*}{1%}}~10% ), 29.8% 的受访者预计会有超过 10% 的明显增长。与此同时, 15.7% 的受访者预计销售额持平, 6.1% 的受访者预计会有适度下降( \left(-1%~-10%\right) ),而 0.5% 的受访者预计销售额下降幅度会超过 10% 。
与2024 年相比,受访者们对2025 年全年的销售预期更为乐观。就一整年来看, 43.4% 的受访者预计销售额将明显增长( 10% 或更多),46% 的受访者预计销售额将适度增长( \overset{*}{\underset{*}{1%}}~10% )。只有 9% 的受访者预计销售额持平, 1% 的受访者预计销售额将适度下降( :1%~10% ), 0.5% 的受访者预计销售额下降幅度会超过 10% 。
综上所述,大部分A3 成员预计2025 年工业自动化产品与技术的销售额将会增长。Shikany 进一步总结了成员们对业绩的期望,他表示:“2025 年会是不错的一年,但可能需要一两个季度才能迎来明显的销售上升期。”

512 到 8160 像素的单色或彩色
线扫描摄影机

Schafter+ Kirchhoff
info@sukhamburg.com www.sukhamburg.comSchäfter+Kirchhoff 开发和制造激光光源、线扫描摄影机系统和光纤产品,供全球分销和使用。
色选机开启安徽视觉产业发展新篇章
作者:安徽省视觉技术协会
曾经,一碗香喷喷的米饭中暗藏“危机”,不经意间咬到的石粒让人“硌牙”,这种困扰早已成为历史,这得益于一项先进技术——色选机。合肥拥有光电产业优势人才团队、先进科研技术、成熟的供应链体系、强大的的产品生产能力,是全球光电分选设备集聚地。
色选机的技术核心为利用视觉识别技术对物料进行精准分选。其工作流程可以分为以下几个步骤:
(1)信息获取:被选物通过振动喂料器均匀分散,进入分选区域后,由线扫描相机快速获取其表面的图像信息。线扫描相机以极高的速度逐行扫描被选物,将每一行的图像信息转换为电信号。
(2)图像处理:图像处理系统对获取的电信号进行分析,根据预设的算法识别异色粒、瑕疵等。例如,杂粮分选,系统会识别出颜色异常、形状不规则等特征,并将其标记为“坏料”。

高压气阀将目标物精准剔除。高压气阀以极快的速度喷射出气流,将“坏料”吹离正常轨道,实现优质产品与杂质的分离。
色选机的应用及作用
食品安全的守护者
色选机,顾名思义,就是利用颜色进行分选的机器。以大米色选为例,它就像一位“火眼金睛”的卫士,能够精准识别并剔除大米中的异色粒、霉变粒、石粒等杂质,有效提升大米品质,保障食品安全。不止于此,色选机还在玉米、坚果、药材、海产等多个食品加工领域发挥着重要作用。
改变食品加工业,促进农业发展
色选机的出现,不仅改变了食品加工业的方式,还对以下方面有积极影响:
(1) 提升食品品质:有效去除杂质,提高产品外观和口感,满足消费者对高品质食品的需求。
(2) 保障食品安全:精准识别并剔除霉变粒、有害物质等,保障食品安全,守护消费者健康。
(3) 提高生产效率:自动化程度高,分选速度快,大大提高了生产效率,降低了人工成本。
(4) 促进农业现代化:推动农产品标准化、规模化生产,提高农产品附加值,促进农业增效、农民增收。
资源再生的法宝、循环经济的助推器
在矿石加工领域,色选机从中小颗粒矿石分选,经过算法升级、人工智能等技术迭代,推出了粉料矿石分选、金属矿分选、大颗粒矿石分选、干湿矿石同选的先进设备,是可以显著提升矿石价值的核心设备;在选矿领域,色选机则充当了质检员的重要角色,煤矸石光电分选有效解决了煤炭产地缺水、水洗煤污染问题,推动了煤矸分选剔除率质的有效提升和产能量的高速增长。在资源再生领域,色选机同样发挥了举足轻重的作用,对回收塑料的破碎、识别、分选、造粒,为塑料垃圾回收利用产业提供了核心技术支持,成为我国循环经济发展中的核心设备。
安徽省视觉产业的发展变化
安徽省视觉产业从色选机起步,并逐步壮大,再从“替代进口”到“核心技术突破”,从而多领域开花,经历了以下几个发展阶段:
第一阶段:色选机开启安徽视觉1.0 时代
色选机产业在崛起与发展的道路上,不断进行技术攻关,推动国产色选机性能不断提升。色选机的发展可分为以下几个阶段:
(1) 突破技术瓶颈:早期,色选机的核心部件主要依赖进口,使得成本居高不下。安徽省企业通过自主研发,在自主研发线扫描相机、超高速超长寿命电磁喷阀、图像处理算法等方面成功实现了关键技术的突破,打破了国外技术垄断,降低了生产成本。
(2) 形成产业集群:随着色选机产业的快速发展,合肥逐渐形成了完整的产业链,包括钣金喷涂、光源、气阀、图像处理软件等零部件上游企业。产业集群的形成,进一步降低了生产成本,提高了产品竞争力。
(3) 超越国际巨头:凭借性价比优势和完善的售后服务,安徽省色选机迅速占领国内市场,并已经在国际市场占据重要地位。最终,安徽省色选机企业超越了日本佐竹、瑞士布勒等国际巨头,同时中国也成为全球最大的色选机生产国和出口国。
第二阶段:从“替代进口”到“核心技术突破”的安徽视觉2.0 时代
(1)核心部件国产化:打破国外技术垄断
随着合肥埃科光电、中科光电等企业的崛起,要色选机的核心部件——线扫描CCD 相机部分,已从主要依赖韩国三星等国外厂商成功实现了国产替代,降低了生产成本,提升了产品竞争力。
值得一提的是,安徽在CMOS 图像传感器(CIS 芯片)领域取得关键突破。以合肥海图微电子为代表的视觉芯片企业,自主研发高性能CIS 芯片,其产品采用先进的背照式工艺,具备高灵敏度、低噪点等优势,广泛应用于工业检测、医疗影像等领域。海图微电子的核心芯片设计完成后,通过与合肥晶合集成电路(晶合集成)合作流片,实现了从芯片设计到制造的本土化闭环,大幅提升了生产规模与供应链稳定性,为安徽省视觉产业注入了“芯”动能。
(2)高速相机:为视觉识别装上“高速引擎”
高速相机进一步提高了色选精度和效率。中科君达等企业研发的高速相机,能够以每秒数万帧的速率捕捉图像,结合自主研发的CIS 芯片与图像处理算法,为视觉识别提供更精准的数据支持。例如,在高速色选场景中,毫秒级的图像采集与处理能力可确保分选精度达到 99.9% 以上,推动了色选机性能的跨越式提升。
企业名称 | 核心领域 | 技术突破 | 行业地位 |
埃科光电 | 工业相机、图像采集卡、自动对 焦技术 | 全球首创多线分时曝光技术、超分辨率 成像技术 | 国产线扫相机替代进口,产品性能国际 领先 |
海图微电子 | CIS芯片设计 | 背照式CIS芯片、高动态范围成像技术 | 国产工业级图像传感器头部企业 |
晶合集成 | 芯片制造 | CIS芯片代工、12英寸晶圆量产 | 中国大陆第三大晶圆代工厂 |
中科君达 | 高速相机、工业检测 | 超高速工业相机、微米级缺陷检测算法 | 半导体检测设备国产化主力军 |
中科光电 | 光电智能分选 | 多光谱线扫成像、人工智能算法 | 色选机领域全球前三 |
安徽省本土企业在这一领域的协同创新尤为亮眼,表现如下:
●中科君达:国内高速相机领军企业,其超高速工业相机打破国外垄断,应用于半导体检测、高速运动分析等高端领域。
●埃科光电:科创板上市,被誉为“国内工业相机第一股”,聚焦高端机器视觉核心部件,其自主研发线阵及面阵工业相机、图像采集卡,产品性能国际领先,适配不同场景下检测需求,应用于工业制造、新能源、生命科学等领域图像采集与处理。
●海图微电子:依托自主研发的CIS 芯片技术,为高速相机提供高性能图像传感器,是该领域国产替代的“隐形冠军”。
\bullet 中科光电:深耕光电分选领域20 年,覆盖农产品、工业品分选等几十个品类,与中科大先进技术研究院共建联合实验室,持续开展多光谱视觉成像、AI 算法等技术研究和产品开发,领航合肥色选新产品推出,连续5 年保持高速增长,荣获国家重点专精特新小巨人企业。
(3)应用领域拓展:从色选到更广阔天地
高速相机与CIS 芯片技术的突破,不仅推动了色选机产业的升级,更催生了多领域的应用革命:
●工业检测:在液晶面板、半导体晶圆检测中,中科君达、埃科光电等提供的高精度视觉系统可实现微米级缺陷识别。
●医疗影像:登特菲等企业将CIS 芯片技术应用于口腔CT 设备,实现三维成像精度提升 50% ,国内市场占有率突破 40% 。
●智能安防:基于国产CIS 芯片的红外热成像仪、太赫兹检测设备,广泛应用于机场、高铁等场景的安全监测。
第三阶段:从“色选机”到“多领域开花”的安徽视觉3.0时代
(1)口腔CT :引领口腔医疗新革命
美亚光电、登特菲等企业成功研发出口腔CT,利用三维成像技术,为口腔医生提供更精准的诊断依据,引领口腔医疗领域的新革命,并迅速占领国内外市场。
(2)多领域应用:视觉技术赋能千行百业
除了口腔CT,安徽省视觉企业还在显微镜、色谱光谱仪器、太赫兹、红外、拉曼等领域取得了突破性进展,产品广泛应用于医疗、工业、科研等多个领域。
●红外成像领域:从“看得见”到“看得清”
红外成像技术能够在无光或弱光环境下捕捉目标的热辐射信息,广泛应用于安防监控、工业检测、医疗诊断等领域。安徽省在这一领域涌现出多家优秀企业,如下:
◆ 航谱时代
核心领域:合肥航谱时代科技有限公司是集科研、开发、生产为一体的国家高新技术企业,具备国内领先的斯特林制冷系统、制冷型红外光电系统及多维感知与AI 算法研发能力,服务于航空航天、石油化工、钢铁矿产、安全消防等各领域。
技术突破:航谱时代通过技术创新,解决我国红外系统产品的卡脖子问题,率先将制冷型红外技术应用于危化气体泄漏监测,开发了针对石油化工领域复杂应用场景的制冷型红外危化气体泄漏可视化监测预警系统产品。该类产品通过运用高精度制冷型红外成像、智能识别和半定量分析等技术,实现了对50 余类危化气体泄漏的实时监测和智能预警,提升了监测的精度和响应速度,提高了监测效率和安全管理能力,使得石化厂区安全管理更加智能化、生产更加绿色化。
行业地位:作为中国长寿命制冷型红外系统的开拓者,是国内少数贯穿制冷系统、机芯组件到整机系统制造,并具有完整产业链的制冷型红外专业厂商之一。目前,制冷机系列产品已进入军队装备序列;红外整机方向形成了中海油某炼化项目、中石化某原油储备项目、中石油某战略储备项目等重大工程的典型交付案例,逐步在炼化一体、储罐区、煤化工、油气田、LNG、钻井平台等领域形成业务网络。
◆ 睿创微纳
核心领域:非制冷红外探测器、红外热成像整机、智能安防系统。
技术突破:成功研发 12\upmum 非制冷红外探测器,技术水平国际领先,产品广泛应用于安防监控、自动驾驶、智能家居等领域。
行业地位:全球非制冷红外探测器领域的头部企业,国内市场占有率超过 50% 。
●太赫兹领域:开启“透视”新视界
太赫兹技术是一种介于红外与微波之间的电磁波技术,具有穿透性强、安全性高等特点,被誉为“改变未来世界的十大技术”之一。安徽省在太赫兹领域也取得了如下显著的进展:
◆ 博微太赫兹
核心领域:太赫兹安检设备、太赫兹成像系统。
技术突破:自主研发被动式太赫兹人体安检仪,可实现非接触式快速安检,广泛应用于机场、地铁等场景。
行业地位:国内太赫兹安检设备的领军企业,市场占有率位居前列。
◆ 中电科38 所(太赫兹团队)
核心领域:太赫兹雷达、太赫兹通信、太赫兹成像。
技术突破:功研制太赫兹高速通信系统,为6G 通信技术奠定基础;太赫兹成像技术在医疗诊断、无损检测等领域取得突破性进展。
行业地位:国内太赫兹技术研发的“国家队”,承担多项国家级重大科研项目。
* 安徽中科太赫兹科技有限公司(中国科学院等离子体物理研究所技术转化)
核心领域:大功率连续波太赫兹光源及室温太赫兹探测器系统;主动太赫兹光成像系统,涵盖人体安检、聚变堆监测设备、医疗检测和治疗、通信和无损检测等广泛应用场景。
技术突破:关键技术包括全自主化的覆盖 0.1 THz~ 2.5THz 频段高功率太赫兹激光源、高灵敏度室温太赫兹探测器、太赫兹智能相机和小型化固态太赫兹光源。开发出高灵敏度太赫兹主动成像系统、太赫兹光谱仪,可应用于药品检测、食品安全等广泛领域,不断提升太赫兹成像、太赫兹探测和太赫兹通讯感知能力。
行业地位:国内太赫兹检测设备的重要供应商,获得国家高新技术企业和多项地方资质认定,2024 年太赫兹高端智能设备销售过亿元。作为行业技术创新引领者,推动太赫兹技术的广泛应用。推动太赫兹产业化和产业链建设,建立核聚变太赫兹激光干涉仪高精监测设备工业基础。
● AI 赋能:开启视觉识别新篇章
随着人工智能技术的快速发展,AI 图像识别、深度学习等技术被广泛应用于视觉领域,进一步提升了视觉识别的精度和效率,为安徽省视觉产业的发展注入了新的活力。
展望未来:打造世界级视觉产业集群
政策支持:为产业发展保驾护航
安徽省政府高度重视视觉产业发展,出台了一系列政策措施,支持企业技术创新、人才培养、市场开拓等,为产业发展营造了良好的环境。
人才培养:夯实产业发展根基
中国科学技术大学、合肥工业大学、中国科学技术大学先进技术研究院、中国科学院合肥物质科学研究院、安徽大学等高校和科研院所,为安徽视觉产业培养了大批优秀人才,为产业发展提供了强有力的人才支撑。其中合肥工业大学作为当地服务产业需求的工科院校,依托其电子信息、光学工程、计算机科学与技术等学科优势,长期为视觉产业培养复合型专业人才。学校与美亚光电、埃科光电等企业共建产学研联合实验室,通过安徽省高等研究院人才项目、卓越工程师学院" 双导师制" 人才培养计划、校企联合课题等形式,为学生提供实践平台。每年培养大量毕业生进入视觉领域头部企业,成为技术研发与产业升级的核心力量。
平台建设:打造产业创新高地
合肥视界、芜湖视谷等产业平台的建立,为视觉企业提供了技术研发、成果转化、市场推广等全方位服务,助力安徽打造世界级视觉产业集群。合肥工业大学智能制造技术研究院牵头联合中科君达、中科光电、埃科光电等行业龙头企业组建安徽省视觉技术协会。协会整合企业、高校与科研院所的资源优势,拟推动技术标准制定与成果转化。
安徽合肥:中国视觉产业的璀璨明珠
领军地位:中国视觉产业的“硅谷”
合肥汇聚了中科院、安徽光机所、中国科学技术大学、合肥工业大学等一批顶尖科研机构和高校,为视觉产业发展提供了强大的技术支撑和人才保障。依托雄厚的科研实力和产业基础,合肥培育了埃科光电、中科光电、中科君达、海图微电子等一批行业领军企业,形成了涵盖光源、镜头、相机、图像处理软件等完整产业链的视觉产业集群。
辉煌成就:从“跟跑”到“领跑”
从色选机起步,到多领域开花,安徽视觉产业走出了一条从无到有、从弱到强的创新发展之路,获得了以下成果:
●色选机领域:合肥色选机产量和出口量均居全球第一,彻底打破了国外技术垄断,成为全球色选机行业的领军者。
●医疗影像领域:美亚光电、登特菲等企业成功研发出口腔CT、医用DR 等高端医疗影像设备,填补了国内空白,并迅速占领国内外市场。
●工业检测领域:中科君达、埃科光电等企业在工业相机、机器视觉系统等领域取得了突破性进展,产品广泛应用于电子、汽车、食品等行业。
安徽合肥,正以其蓬勃发展的视觉产业,向世界展示着中国科技创新的强大力量。相信在不久的将来,安徽合肥必将成为全球视觉产业的创新高地和产业中心,为世界视觉产业发展贡献更多中国智慧和中国力量。

华南国际工业博览会South China International Industry Fair
工业引领 智享未来
2025年6月4-6日
深圳国际会展中心(宝安新馆)
June 4-6, 2025
Shenzhen World Exhibition &
Convention Center
www.sciif.com 同期展会 Concurrent Exhibitions



工业自动化展
Deutsche XZQMesse
汉诺威米兰星之球展览(深圳)有限公司
电话Tel:0755-23207500
邮箱Email:LFSZ@hmxzq.comDeutsche MesseFHER
汉诺威米兰展览(上海)有限公司
电话Tel:021-20557000(上海)020-89554629(广州)
邮箱Email:scif@hmf-china.com
东浩兰生会展
(深圳)有限公司
电话Tel:021-22068388
邮箱Email:SCllF@shanghaiexpogroup.com
深圳东浩兰生惠智
展览有限公司
电话Tel:0752-3165631
邮箱Email:cmm86@cmm86.com
嵌入式视觉
SWaP-C 原则实现低成本高清热成像相机
紧凑型热成像相机适用于自动检测、自动驾驶车辆、无人机以及生产设备监测等应用场景。
作者:Wade Appelman,Owl Autonomous Imaging公司
对于大规模应用场景下的相机选型,有两个关键考量因素:性能和对资源的占用情况,后者包括了对尺寸、重量、功耗和成本的限制。对于可见光波段的相机,无论是单色相机还是RGB 相机,机器视觉、监控、手机等领域的大规模应用需求,推动了相机性能的提升,同时降低了整体资源占用。
以往,对于工作在长波红外(LWIR)波段的热成像相机,还没有哪种应用提出过类似的要求。但如今,美国国家公路交通安全管理局(NHTSA)要求,2029 年起所有汽车都必须配备昼夜自动刹车功能,这使得对高性能、紧凑型热成像相机的需求变得极为迫切。

热成像技术问世已有近百年,1929 年出现了首款两像素相机,20 世纪60 年代有了冷却型线扫描传感器,70年代出现冷却型面阵产品,80 年代则诞生了非制冷微测辐射热计阵列。如今,性能最高(价格也最为昂贵)的热成像相机是制冷型的,但在市场上应用数量占绝大多数的还是体积更小、价格更便宜的非制冷相机。
尽管如此,非制冷相机的成本也与性能紧密相关,其中两个最重要的性能是空间分辨率(即阵列中的像素数量)和温度分辨率(即能够分辨的场景中最小的温度差异)。
不同的应用场景,对这两个性能的要求差异很大。
对热成像相机的求因应用而异
首先来看要求最为严苛的应用:关键防务系统要求空间分辨率达到 1024x768 像素或更高,温度分辨率通常低于 50mK ( 1mK=0.001 C )。医疗应用可能仅需要适中的分辨率,比如 256x320 像素,温度分辨率低于50mK 以用于分析皮肤温度。相比之下,建筑热泄漏检测可能只需要 60x80 像素分辨率,并且只需要1℃的温度分辨率。
医疗用热成像相机的售价可能高达数千美元,而手持式热泄漏检测相机仅需几百美元。虽然这些价格肯定低于防务系统所用的热成像相机可能高达数万美元的价格,但是即将到来的汽车应用中,则要求下一代热成像相机要有更低的成本,并且还能提供足够的空间分辨率和温度分辨率,以便能在 400m 远的距离内的任何位置发现行人。
如果热像仪能满足汽车对成本、性能和极端环境耐受性的严格要求,它就可以拓展到可见光相机批量应用的领域。这需要满足以下几个方面:
如果热成像相机能够同时满足汽车行业对成本、性能以及极端环境耐受性的严苛要求,它就能应用于目前只能由可见光相机服务的一些大规模应用场景。比如:
• 用于夜间及雨雾天气下远距离监控的家用热成像监控系统。
• 在无自然光或人工照明情况下安全行驶的自动驾驶车辆。
• 从轻量型、低成本无人机获取热数据。
• 持续监测生产设备是否过热。
• 检查电路板等新组件是否存在热点。
那么,热成像相机如何才能实现这些大批量应用的目标呢?
兼具低成本和高性能
防御领域将对热成像相机的要求简称为SWaP-C,它的意思是要集中精力缩小尺寸、减小重量和功耗,同时降低成本。要成功实现这套组合目标,需要回归设计原则,使新设计避免因改进物理参数而导致成本增加的问题。
在非制冷热成像技术中,需要特别注意的问题包括微测辐射热计阵列的结构、读出电路的配置、校正图像数据的方法以及相机电子器件的架构。以上这些方面在热成像相机的设计中都必须重新考虑,以实现小型、高性能、低成本的目标。
制冷型相机体积较大,因为其所需的工作温度必须使用斯特林循环制冷器实现。这些制冷设备的体积、可靠性和成本因素促使人们转向非制冷相机。但是,与常用的可见光相机相比,非制冷热成像相机的体积仍然较大。
这些差异与一些棘手的要求有关,例如像素大小要与检测的辐射波长成正比。一台高清( 1080p )热成像相机需要宽度在2cm 左右的传感器,而类似的可见光传感器的宽度可能不到该尺寸的 10% 。同样的因素导致热成像相机需要更大的光学元件。因此,减小尺寸就需要尽量缩小有源阵列之外的传感器面积,限制封装尺寸,并尽可能去除相机中的外部支持电路。
在相机中,减轻重量主要是随着尺寸的减小而实现,另外还有一些额外要求,即相机外壳和任何必要散热器的重量应尽量减轻,所选用的连接器本身要轻便、又能适配轻质的对接连接器和电缆。同样,镜头座和镜头也必须考虑重量因素。
长期以来,非制冷热成像相机需要在传感器前方安装一个机械快门组件,以便定期提供传感器校准所需的暗图像,这对尺寸和重量都产生了负面影响。这个快门不仅对SWaP-C 中的所有因素都产生了负面影响,而且也会影响图像数据流,而在依赖连续数据确保安全的系统中,这种情况是无法容忍的。取消快门将为所有这些方面都带来重大改进。
虽然快门只是间歇性用电,但相机其余部分是持续耗电的,必须将其降至最低。热成像相机的主要耗电部件是带有读出电路(ROIC)的传感器及其所需的支持电路,以及通过连接电缆传输信号的驱动器。因此,一个可探索的降低功耗的途径,是将尽可能多的外部功能集成到ROIC 设计中。
有效地将SWaP 原则应用于设计中的另一个好处是,所有这些方面的改进将使相机更易于集成,且成本更低。
减少组件数量
最后是成本考量。降低成本最直接的方法是减少所需组件的数量。组件越少,电路板面积越小,板间互连也越少。当然,只有在组件价格不会失控上涨的情况下,减少组件数量才能降低成本,所以一般来说,组件必须利用已应用于其他低成本产品的标准制造工艺。此外,还必须考虑外部组件成本,包括光学元件、电缆、电源和防护装置等。
如果设计师愿意放弃许多传统的相机设计方法,那么这套SWaP-C 改进技术可应用于热成像相机的设计。具体而言,如果将传感器重新设计为提供数字数据而非传统的模拟视频信号,就能实现一系列改进。
设计数字热传感器
先从显而易见的方面说起:如果传感器具有数字输出,那么无论是在相机内部还是作为图像采集系统的一部分,都无需进行外部转换。这就可以使用计算机原生支持的众多标准数字接口之一。相机就变成了另一个外设。
使 ROIC 数字化,可将一些外部数字处理功能转移到芯片上。最重要的是,合适的模数转换架构可以在数字化过程中对传感器的不均匀性(包括偏移和增益)进行校正。用于这些校正的数据,可以是传感器测试期间生成的模式与传感器特性(如温度)实时测量数据的组合。然后,可以利用 ROIC 自身的内存和计算能力进行校正。这样的传感器无需机械快门,因此可以在不中断图像数据流的情况下自行校正。
赋予 ROIC 数字功能的一个重要额外好处是,有可能对热成像相机在受限应用中的使用进行保护。例如,如果无人机坠毁后,其中的监测相机在检测到授权主机丢失时能自动禁用,以防止敌方在他们的设备中继续运作该相机。正是在ROIC 内部实现的这种最安全的功能,使得高性能热成像相机可以在无需贸易许可的情况下,随着汽车全球发货。

这样的ROIC 使用标准器件制造工艺即可生产。接下来要做的是,使用另一套现有工艺在ROIC 上构建微测辐射热计阵列,然后在晶圆级操作中,为微测辐射热计提供精确热检测所需的真空环境。图 2 展示了结果,并与带有支持电路的传统微测辐射热计阵列结构进行了对比。值得注意的是,阵列覆盖了整个ROIC,消除了面积浪费,并将分辨率从VGA 提升至 1280x800 像素。
当阵列覆盖整个ROIC 时,将该器件安装在电路板上并采用背面散热方式,器件的封装尺寸仅略微大于器件本身。所需的电路板面积也比有源传感器的面积大不了多少。由于所有必要的数据调节都在ROIC 上完成,电路板上仅需要电源调节和数据驱动器。结果如图3 所示,其展示了一个集成在一块单板上的完整相机模块,可接受单一电源供应,并通过高速数字链路传输实时校正后的视频数据。

对于相机模块,用户只需添加一个带有小尺寸后置散热器的外壳和一个镜头安装夹具。电源和数字视频通过一根电缆传输。
这款高清相机设计实现了SWaP-C 理念的目标:体积小、重量轻、功耗极低,仅需一个简单的外壳和单一外部连接。通过使用标准制造工艺和消除对复杂辅助电子设备的任何需求,成本得到了控制。
高性能、低成本和低资源占用,使SWaP-C 设计理念成为许多大规模热成像应用的理想选择。
光学引领未来
新品 TECHSPEC
Ucw 系列定焦镜头
高达 ¹⁄2 " 的 C-Mount 镜头• 超紧凑型 (UC) 高分辨率镜头,适用于小型传感器• UC 系列定焦镜头的防水版本• 符合IEC IPX9K 的密封防护等级
深度学习
深度学习在机器视觉中的作用及应用
通过阐述深度学习的优势,详细介绍了深度学习如何使机器视觉更容易实现且功能更强大。
作者:斑马技术
尽管深度学习技术是工业 4.0(制造业发生的第四次工业革命,特别是利用由数据和机器学习驱动的智能自主系统)的关键推动因素,但值得注意的是,深度学习无法独自应对各类机器视觉任务。它需要精心的准备和维护才能真正发挥效用。本文将详细阐述机器视觉(主要为确保产品质量、跟踪和指导生产而进行的自动获取和分析数字图像的计算机化过程)如何从深度学习中获益,因为深度学习正让机器视觉更易实现且功能更强大。
机器视觉与深度学习:面临的挑战
机器视觉通常在产品制造过程中执行识别、检测、引导和测量任务。传统的机器视觉软件通过特定的算法和基于启发式的方法来处理这些任务,而正确应用这些方法通常需要专业知识、技能和经验。
这些方法或工具在处理和适应复杂多变的条件时,有时会显得力不从心。深度学习虽能提供很大帮助,但它需要基于先前收集的样本数据进行艰苦的训练,才能达到行业普遍要求的结果水平(即 3σ 标准,至少99.7% 的过程准确率)。为进行适当训练而收集和标记样本数据,可能既繁琐又困难,甚至难以实现。现代制造过程通常良品率很高,所以缺陷或错误样本可能极难获取。此外,有时还需要更多训练,来应对可能对生产产量产生不利影响的意外情况。
深度学习的另一个挑战是,要弄清楚它在某些情况下为何无法正常工作,以便对训练过程乃至特定应用的方法做出必要调整。最后,必须认识到深度学习主要用于对数据进行分类,并非所有机器视觉任务都适用这种方法。
深度学习的优势与局限
如前所述,深度学习是将数据(如图像或其组成像素)分类到两个或更多类别的过程。深度学习特别适合识别对象或对象特征,例如识别小部件
A 与小部件 B 的不同,它还特别擅长检测缺陷,无论是瑕疵、异物的存在,还是正在组装的部件上关键组件的缺失。它在识别文本字符和符号(如产品有效期和批次代码)方面也很有用。
尽管深度学习在复杂多变的情况下表现优异,例如在不均匀或有纹理的图像背景中,或者在正常且可接受的外观变化的小部件图像中发现异常(见图 1),但仅靠深度学习无法以极高的位置精度和准确性定位图案。
深度学习分析是基于概率的过程,因此对于要求精确的工作来说并不实用,甚至不合适。高精度测量仍然是传统机器视觉软件的优势领域。读取条形码和二维码的解码部分本质上依赖特定算法,也并非深度学习技术适用的领域(见图 2)。
深度神经网络
深度学习利用深度神经网络(DNN)来实现其分类功能。DNN 也被称为模型。一个 DNN 由多个层组成(见图 3):输入层定义了神经网络必须处理的图像属性;隐藏层(统称为骨干网络)提取复杂度逐渐增加的特征(如边缘、角等),并建立一个特征空间;输出层(通常有多个,统称为头部)根据保留的特征进行分类,并输出所谓的推理或预测结果。



训练前的准备工作
为了使模型发挥作用,必须首先使用参考图像对其进行训练以实现特定功能。在进行训练之前,用户需要花时间仔细收集和准备一组参考图像。图像收集设备(包括相机、镜头和合适的照明设备)必须与部署系统中使用的设备相同或几乎相同。使用差异较大的设备(如手机)收集的图像,无法训练出适用的模型。
参考图像集(即数据集)必须足够大,并且能够代表预期的应用场景;否则会导致预测结果不佳。数据集的确切大小取决于应用的复杂程度(例如差异的细微程度,或者从一个期望类别中辨别差异的难度)以及应用场景的可变性。所需的训练类型也会影响数据集的大小。
虽然建议的数据集大小各不相同,但通常每个期望类别大约需要
100 张图像。在某些情况下,如果应用场景较为简单(例如图像中前景物体单一且背景均匀稳定),或者不同场景可以轻松合成,那么使用最初仅包含 20 张
图像的数据集进行训练也是可行的。
获取图像以生成平衡的数据集显然具有挑战性,因为一些可能的过程变化(如异常情况的出现)非常罕见。可以通过经典图像处理合成图像来克服这些不足,这一过程称为数据增强(见图 4)。
理想情况下,一个数据集包含大量图像,因为在训练之前,它至少需要被划分为两个子集,最好是三个子集。第一个子集是训练集,用于训练模型,训练过程涉及调整网络权重。第二个子集是验证集,用于通过跟踪分类结果与预期结果之间的差异,来监控训练过程。第三个子集(可选)是测试集,用于在训练结束时独立评估训练后模型的无偏性能;如果不使用测试集,验证集也将承担这项性能评估任务。验证集的结果可以表明是否需要调整学习参数和数据增强策略,或者是否需要扩大原始数据集。
异常检测是一个显著的例外,它不需要平衡的数据集。对于这种模型,数据集的准备重点在于区分正常和异常情况。训练集仅包含正常图像,用于让模型学习正常情况的特征。为确保有效监控和评估,验证集和可选的测试集需要包含一些异常图像示例,以帮助评估模型检测异常情况的能力,确保其在实际场景中的有效性。
在任何情况下,数据集都应考虑到所有可能遇到的变化,包括目标物体本身外观和呈现方式的潜在变化,以及其所处环境的变化(如光照差异)。必须注意不要引入歧义,因为歧义可能会导致对特定类别产生不必要的偏见,从而导致预测结果不佳。例如,拍摄一系列小部件的图像时,符合质量控制标准的小部件图像在特定光照条件下拍摄,而不符合标准的小部件图像则在不同光照条件下拍摄。在这种情况下,一旦训练完成并部署深度学习系统,若符合标准的小部件在第二种光照条件下出现,系统很可能会将其错误分类,除非通过数据增强解决了这个问题。这个例子说明了糟糕的模型训练的一个基本缺陷,以及它对预测结果的影响。

无论进行何种类型的训练,一旦获取参考图像后,都必须仔细将其分类到各个期望类别中,并且每张参考图像都必须根据其所属的特定类别进行标注。
有效的标注对于确定真实情况至关重要,这是训练成功的关键(见图5)。数据集的标注对于模型的有效训练至关重要,因此必须由该领域的专家(如质量控制技术人员)来完成。
稍有例外的是,在为异常检测训练准备参考图像时,非异常图像会由软件自动标注。用户负责识别并标注异常图像示例,这些示例会存储在单独的位置。

模型的训练与评估

所有可用的模型基本上都带有预训练的骨干网络。因此,用户的任务是针对特定应用对模型进行训练,这个过程通常称为迁移学习。一些模型在经过这种训练后,还可以通过微调进一步提高性能。
训练模型需要设置和调整众多超参数。其中一些超参数在训练开始前设置。幸运的是,商业软件提供的默认设置通常就足以满足要求。其余超参数的调整通过迭代过程自动完成,这一过程包括调整模型中的数学权重以最小化分类误差(见图 6)。虽然这个过程可能耗时很长,但数据终端中图形处理单元(GPU)提供的强大并行处理能力,能大大加快训练速度。
模型训练完成后,在部署之前需要对其质量进行评估。评估指标有多种,有些指标适用于不同类型的模型,有些则特定于某种模型。图像分类和目标检测模型依靠混淆矩阵来展示每个类别的正确和错误结果。精确率、召回率和 F1 分数等指标是从混淆矩阵中推导出来的,用于评估模型性能。如果有一些异常图像参与评估,混淆矩阵也适用于异常检测模型。
评估分割模型的质量主要使用交并比(IoU)指标,它用于衡量预测结果与真实情况之间的重叠程度。一般认为 IoU 达到 50% 就算不错,超过 70% 则非常好甚至优秀。然而,仅靠 IoU 并不能全面反映模型的性能。由于分割模型执行像素级分类,因此像IoU 和混淆矩阵这样的指标可能很难解释,特别是对于视觉背景非常重要的缺陷检测。因此,目视检测不可或缺。
一个强大的用户界面(UI)应该提供一种简单的方法,将真实情况和模型输出的分割区域及轮廓叠加显示,以方便进行目视检测。这种视觉确认对于准确评估分割结果的质量至关重要(见图 7)。它有助于判断模型的预测与预期的契合程度,特别是在定量指标不足的复杂场景中。因此,通过将视觉检查与标准指标结合起来,确保对其性能进行更综合评估,大幅增强了对模型有效性的信心。
最佳组合
了解深度学习在机器视觉中的适用性后,就会明白深度学习是对生产工厂中用于自动视觉识别、检测、引导和测量系统的经典软件的补充,而非替代。因此,包含传统工具和深度学习工具的软件,是开发机器视觉系统的明智之选。
虽然深度学习已经发展得足够成熟,使用时不一定非要机器学习专家参与,但深度学习要想发挥作用,仍需要细致的准备工作和深入的应用知识。具备用户友好图形界面的机器视觉软件,对于确保深度学习的效率至关重要,无论是准备训练数据集、监控训练过程还是分析训练结果。商业软件还为用户提供可靠的技术支持,用户可以借此获取长期处理众多行业应用所积累的知识和技能。

虽然深度学习通常需要大量的准备工作和特定领域的知识,但Zebra基于DL 的OCR 工具提供了一个专门为OCR 任务量身定制的预训练DNN。这种预训练模型避免了标准深度学习工作流程中通常需要的大量数据集准备和漫长的训练期。因此,Zebra 基于DL 的OCR 工具便于快速部署,减少了实现卓越读取性能所需的时间和专业知识。这种方法展示了预训练模型如何简化深度学习与机器视觉系统的集成,从而成为传统的机器视觉工具的补充并提高运营效率。

于深度学习的图像分类工具。ZebraAurora Imaging Library™是一个软件开发工具包(SDK),用于通过编写程序代码创建应用程序。ZebraAurora Design Assistant™是另一种,即它是一个集成开发环境(IDE),通过构建和配置流程图来创建应用程序(见图8)。
这两个软件包都包含使用AuroraImaging Library CoPilot 交互式环境训练的图像分类模型(见图6),该环境还具有生成程序代码的能力。
软件开发包的用户都可以完全访问Zebra Vision Academy 的在线门户,该门户提供了一系列关于使用该软件的点播视频教程,例如如何进行图像分类。用户还可以通过Zebra 的专业服务获得应用工程师以及机器视觉和机器学习专家的帮助,以获得特定应用的帮助。

结论
深度学习软件使机器视觉系统能够更有效地识别物体或物体特征、检测缺陷或异常情况,以及识别文本字符和符号。深度学习还可以通过自动学习复杂的新模式,随着时间的推移不断提高性能。
用户若对深度学习软件使用背后的训练过程有基本了解,将从中受益。但他们也应该知道,在机器视觉应用中部署深度学习并不困难。
Zebra 的深度学习工具使其Aurora Imaging Library 和 AuroraDesign Assistant 软件平台能够应对以前对于传统机器视觉算法来说过于复杂的挑战。借助Zebra 的深度学习软件工具,视觉工程师可以构建强大的定制解决方案,以增强当前的检测或字符识别应用程序,甚至实现以前不可能的机器视觉任务。
Zebra Aurora软件
Zebra Aurora 提供成熟的软件开发包,其中包括经典的机器视觉工具以及基于深度学习的图像分类工具,其中包括经典的机器视觉工具以及基


慕尼黑上海电子生产设备展
M SMT表面贴装技术 M 线束加工与连接器制造
M 点胶注胶 电子化工材料
M 机器人及智能仓储 运动控制测试测量 电子组装自动化元器件制造 新能源汽车技术
M 智慧工厂
光源
方形、圆顶两种无影光源的应用比较
以充电宝表面检测、锂电池极耳检测、PCB上mark点检测的应用案例来展示方形无影光源相较于圆顶无影光源的多项优势。
作者:东莞乐视自动化科技有限公司
在现代工业自动化和质量控制中,机器视觉系统扮演着至关重要的角色。作为机器视觉系统的核心组成部分,光源的质量直接影响着图像采集的效果,进而影响整个系统的性能。

圆顶光源(碗光)是一款均匀性较好的面阵光源,其特殊的圆弧结构可以呈现良好的漫反射效果,能有效消除反光与曲面影响,实现均匀的成像;但其体积较大,在狭窄空间应用时,灵活性较差。
乐视科技推出的方形无影光源FDM 系列,其效果与圆顶光源接近,但可有效解决常规圆顶光源视窗遮挡、尺寸过大等问题。除此之外,在体积、应用灵活性方面,方形光源相比圆顶光源也更具优势。本文将详细介绍方形无影光源与圆顶无影光源的特点及其在机器视觉中的应用比较。
方形无影光源FDM 系列的特点:• 均匀性好、亮度高;• 照射面积大、应用范围广泛;• 可大面积多个相机均匀照射;• 外形灵活多变、开孔可根据实际需要定制。
案例展示
(1)充电宝表面检测
图2 为充电宝实物照片,产品为银色反光充电宝,表面反光。


图3 为采用圆顶无影光源的架构图(a)和成像效果(b)。从图2 中可见,一次性检测视野较大,但因为受圆顶光源开孔影响,成像有一半区域被圆孔遮挡,存在光源孔小背面影响。
图4 为采用方形无影光源的架构图(a)和成像效果(b)。从图3 中可见,一次性检测视野较大,方形无影光源开孔为椭圆,可避开夹角大的镜头,通光成像无遮挡,图片成像正常。
(2)锂电池极耳检测
图5 为被检测的锂电池极耳,产品为手机电池, 60mm 左右大常规视野,此时只需要检测两个极片的焊点,极耳片有反光且不平整,需要采用无影光类型,并且长边比较重要,对宽边适当照顾即可。

图6 为采用圆顶无影光源的架构图(a)和成像效果(b)。从图5 中可见,圆顶无影光源圆孔小,有背面影响,并且圆顶光源为圆形,不仅要按照较长的边选取光源尺寸,还占用较大空间。



图7 为采用方形无影光源的架构图(a)和成像效果(b)。从图6 中可见,采用方形无影光源时,可根据视野形状选取合适的尺寸即可,顶部成像开孔为椭圆,可尽量照顾到照射产品的均匀性。
(3)PCB 上mark 点检测图8 为被测试的PCB 图片。

图9 为采用圆顶无影光源的架构图(a)和成像效果(b)。从图8 中可见,检测产品视野大,圆顶光源放低会有背部孔遮挡、放高不均匀的问题。
图10 为采用方形无影光源的架构图(a)和成像效果(b)。采用方形无影光源对PCB 进行检测,视野非常大且需均匀照射,可根据比例开椭圆孔,有利于节省光源照射面积。


综上所述,在机器视觉检测方案中,视觉光源选型是重要的组成部分,光源方案的正确选择有利于整个视觉系统的顺利部署,合适的光源可有效节省成本及安装空间。方形无影光源以其均匀照明、高亮度、可调光强、无影效果、高显色性、长寿命与低功耗、紧凑设计、多种波长可选、散热良好和易于控制等特点,成为机器视觉系统中不可或缺的重要组成部分。
由于方形无影光源具有的多项优势,其适用于多种应用场景,例如在工业检测领域,用于检测不平整产品表面的缺陷、反光物体表面检测等;在电子制造领域,在PCB 板检测、元器件焊接质量检测中发挥重要作用;在医疗影像领域,用于医疗设备的图像采集,提高诊断的准确性;在食品分选领域,在食品颜色、形状分选中提供高显色性和均匀照明。随着工业自动化和智能化的发展,方形无影光源的应用前景将更加广阔,会继续为各行各业的质量控制和检测提供强有力的支持。
图像传感器
为机器视觉应用选择合适的SWIR 传感器
短波红外(SWIR)成像系统可以完成传统机器视觉成像系统无法完成的任务,例如识别水果、蔬菜的含水量或瓶内的液位。
作者:Cory Boone,Nicholas Sischka公司
使用短波红外(SWIR)波长的机器视觉,可以完成传统成像系统很难完成甚至无法完成的特殊任务,例如SWIR 成像可以透视在可见光条件下不透明的塑料瓶,来测量瓶子内物质的多少(见图1)。

近年来,SWIR 相机传感器的进步显著降低了其成本,这也开辟了SWIR 机器视觉应用的新浪潮。然而,一些最新的SWIR 传感器优先采用缩小像素尺寸的方法来最大限度地提高分辨率,这使得传感器的成本又回升到了以前的水平。虽然SWIR 成像是获取传统成像无法获得的信息的强大工具,但是SWIR 成像也给系统中使用的光学器件带来了新的挑战。
本文将深入探讨SWIR 成像的发展趋势以及它们在机器视觉领域的应用潜能。
新一代传感器使SWIR成像变得更容易
SWIR 成像传感器制造技术的最新进展,催生出了新一代传感器,它们价格实惠,波长范围涵盖了 0.4~1.7\upmum 的可见光和SWIR 波段,同时还具有低噪声和高量子效率(量子效率,用于表述入射光转换为电信号的效率)。虽然低噪声和高量子效率在可见光波段的传感器中已经实现了多年,然而直到最近,SWIR 传感器才开始实现低噪声和高量子效率。
多年来,基于砷化铟镓 (InGaAs) 的传统SWIR 传感器,能在SWIR 波段实现高性能,例如它们实现了所有可用SWIR 传感器类型中的最高效率和灵敏度。然而,因其制造过程难度较高,导致成本过高。虽然更实惠的新一代SWIR 传感器无法实现与InGaAs 传感器同样的高性能,但它们在分辨率、噪声和效率方面的表现,足以满足许多成像系统的需求,并且成本明显低很多。
SWIR成像的关键考虑因素
当使用可见光成像时,人们很容易考虑红光照明是否会突出红色部分,从而增强对比度,或者考虑蓝光照明是否会使背景看起来更暗。而对SWIR 成像,因为人们用肉眼无法看到SWIR 光,导致人们对SWIR 成像的直觉不强,所以很难用肉眼确定哪种SWIR 波长最适合某种应用。因此,系统设计人员在创建SWIR 机器视觉系统时,通常需要提前确定被检测材料的光谱特性。
为某个应用确定所需的正确SWIR 波长,一种方法是找到被成像材料的现有文档。文档中材料的吸光度或透射率图,显示了哪些波长会显得更亮或更暗,哪些波长会提供最佳对比度,例如硅对波长超过 1100nm 的SWIR 波长是透明的(见图2)。因此,SWIR 成像通常用于识别各种类型的硅缺陷,例如裂纹检测、键合检查,发现晶圆内部缺陷,检测硅基板上由不同材料形成的电路中的缺陷。

在系统开发阶段,还可以使用SWIR 高光谱相机和宽带照明光源,来确定最佳波长。它可以捕获许多覆盖不同波长的图像以及每个像素的光谱特征。系统设计人员可以利用这些信息,确定一个或多个感兴趣的波长是否具有明显的吸收或透射峰值,从而使机器视觉系统能够最大限度地提高对比度并完成任务。下文中的“SWIR 成像应用”部分将用一个示例进行介绍。
虽然高光谱相机和宽带光源成本很高,但它们能识别感兴趣的关键波长。当最终系统批量生产时,系统设计人员会使用专门针对该特定波长而优化的更简单的SWIR 相机和光源,从而使最终系统更具成本效益。
当使用高光谱光源和相机进行产品开发时,有时无法通过使用单个波长或一小组波长达到对比度最大化,最终系统还需使用更复杂的高光谱系统。这不仅增加了成像镜头的复杂性,还在本就昂贵的相机和光源基础上增加了成本。但是,这在塑料回收、食品质量检验和异物检测等一些材料分类应用中是必需的。
SWIR成像应用
水分识别是SWIR 成像在机器视觉中的一种常见应用(见图3)。水在 1450nm 附近有一个吸收峰,对于SWIR成像系统来说,该吸收峰非常暗。这一特性在水果检查、食品加工、瓶子灌装液位检查和农业检测等多种应用中都很有用。
并非所有液体都能像水一样吸收SWIR 波长,因此SWIR 成像可以轻松区分在可见光条件下看起来相同的液体(见图4)。
SWIR成像镜头的特殊挑战
虽然许多为可见光设计的成像镜头组件也可以传输一些SWIR 光,但是使用专门为SWIR 波长范围设计的镜头,可以显著提高SWIR 成像系统的性能。这改变了镜头设计中优化的波段范围,并采用可最大化SWIR 光通量的玻璃种类以及应用于镜头元件的涂层。
由于锗、硅、蓝宝石和硒化锌等材料对SWIR 波长具有更高的透射率,因此这些材料可以提高SWIR 成像性能,但是它们比传统成像镜头中使用的玻璃种类价格更高。


最新的SWIR传感器使价格回升
最新的SWIR 传感器,在价格上并没有优势。这些新型传感器提供了比其他可用传感器类型更小的像素尺寸,并提高了系统分辨率,但这会使成本回升到以前的水平。它们不仅使SWIR 相机更昂贵,而且对使用的成像镜头也提出了更高要求,这也使镜头更加昂贵。为了实现足够高的分辨率以充分利用这些新型传感器,光学设计变得更加复杂,公差也更加严格。
由于所需材料的特殊性,SWIR 传感器的成本已经比较高了,这使得采用最新SWIR 传感器的SWIR 系统成本增加了两倍。这可能会导致最新SWIR 传感器对机器视觉领域的影响力不如上一代SWIR 传感器,因为上一代SWIR 传感器使得机器视觉应用在成本上更容易接受。
综上所述,SWIR 成像可以实现传统可见光成像无法实现的任务,其优异表现令人印象深刻。近年来SWIR 传感器成本的下降,使得SWIR 成像获得了更多应用。虽然最新的SWIR 传感器具有的较小像素尺寸优势,有利于实现SWIR 系统的最高性能,但其成本过高。因此,最新的传感器可能会被许多机器视觉系统设计人员忽视,并且无法取代上一代更实惠的SWIR 传感器。
传感器融合
ADAS 系统中的传感器创新在道路交通中挽救生命
作者:Bahman Hadji,安森美汽车感知事业部产品营销高级经理
交通安全是一项巨大的挑战,据悉每年有110 多万人因道路交通事故而丧生,另有约2000\~5000 万人因此而受伤。
造成这些事故的一个主要原因是驾驶员失误。汽车制造商和政府监管机构一直在寻找提高安全性的方法。近年来,先进驾驶辅助系统(ADAS)在帮助减少道路伤亡方面取得了巨大进步。
本文将探讨ADAS 在提高道路安全方面的作用,以及对实现这一目标至关重要的各种传感器技术。
ADAS的演变和重要性
自上世纪70 年代首次引入防抱死制动系统(ABS)以来,ADAS 技术在乘用车中的应用稳步增加,安全性也相应提高。据美国国家安全委员会(NSC)估计,仅在美国,ADAS 就有可能避免约 62% 的交通死亡事故,每年可挽救超过20,000人的生命。近年来,自动紧急制动(AEB)和前撞预警(FCW)等ADAS 功能已变得越来越普及,超过1/4 的车辆都配备了这些功能,以帮助驾驶员预防事故并最终挽救生命。
ADAS 需要多种技术协同工作。一套感知套件充当系统的“眼睛”,检测车辆周围环境并为系统的“大脑”提供数据,后者利用这些数据计算出车辆的执行决策,以辅助驾驶员。例如,当检测到前方有车辆且驾驶员未踩下刹车时,AEB 会自动刹车,使车辆及时停下,避免追尾碰撞。ADAS 感知套件由一套视觉系统组成,该系统包括一个车规级摄像头,其核心是一个高性能图像传感器,可捕捉车辆周围环境的视频流,用于检测车辆、行人、交通标志等,在低速行驶和停车情况下显示这些图像以辅助驾驶员。摄像头通常与毫米波雷达、激光雷达(LiDAR)或超声波传感器等深度感知系统配合应用,这些传感器提供深度信息以增强摄像头的二维图像,增加冗余度并消除物体距离测量的模糊性。


对于汽车制造商及其一级系统供应商来说,实施ADAS 系统可能是一项挑战:处理多个传感器产生的所有数据的处理能力有限,而且传感器本身也有性能限制。汽车行业的要求决定了每个组件都必须具有极高的可靠性,不仅包括硬件,还包括相关的软件算法,因此需要进行大量测试以确保安全。系统还必须在最恶劣的照明和天气条件下保持稳定的性能,能够应对极端温度,并在整个车辆生命周期内可靠运行。
ADAS系统中的关键传感器技术
现在让我们来详细了解一下ADAS 中使用的一些关键传感器技术,包括图像传感器、激光雷达(LiDAR)和超声波传感器。每种传感器都会提供特定类型的数据,通过软件算法对这些数据进行处理,并将这些数据相互结合,从而生成对环境的准确而全面的了解。这一过程被称为传感器融合,它可以通过多种传感器模式的冗余来提高软件感知算法的准确性和可靠性,从而通过更高的置信度决策实现更高级别的安全。这些多传感器套件的复杂性可能会迅速上升,算法需要越来越强大的处理能力。与此同时,传感器本身也在变得越来越先进,从而可以在传感器级而不是在中央ADAS处理器上进行本地处理。

(1)汽车图像传感器
图像传感器是车辆的“眼睛”——可以说是任何配备ADAS 的车辆中最重要的传感器类型。从自动紧急制动、前方碰撞预警和车道偏离警告等“机器视觉”驾驶辅助功能,到用于泊车辅助的 360° °环视摄像头和用于电子后视镜的摄像头监控系统等“人类视角”功能,再到可检测到分心或疲劳的驾驶员并发出警报、以防止事故发生的驾驶员监控系统,图像传感器提供的图像数据可用于实现各种ADAS 功能。
安森美(onsemi)提供包括Hyperlux 系列在内的各种图像传感器,这些传感器以低功耗提供出色的图像质量。Hyperlux 传感器像素架构包括创新的超级曝光成像方案,可通过LED 闪烁缓解(LFM)捕获高动态范围(HDR)帧,克服了LED 前后车灯或LED 交通标志因为脉冲频闪造成的误读问题。
Hyperlux 图像传感器设计用于应对具有挑战性的汽车场景条件,例如在高架桥上方的直射阳光下,能够捕捉高达150dB 的动态范围。配备Hyperlux 图像传感器的摄像头在处理极端情况时的表现远优于人眼,在远低于1lux 的光照水平下也能正常工作。
安森美的Hyperlux 图像传感器包括 800 万像素的AR0823AT 和300 万像素的AR0341AT。这些数字CMOS 图像传感器采用 Hyperlux2.1\ensuremath{ \upmum} 超曝光单光电二极管像素技术,具有出色的低照度性能,同时还能在同一帧图像中捕捉高照度和低照度场景中的宽动态范围。超级曝光像素可在一帧图像中实现足够大的动态范围,从而实现“无忧设置”的曝光方案,有效消除了在光线条件发生变化时自动调节曝光的需要,例如在晴天驶出隧道或停车场时。
(2)深度传感器(激光雷达)
精确测量物体与传感器之间的距离,被称为深度感知。深度信息可以消除场景中的模糊性,对于各种ADAS功能以及实现更高级别的ADAS 和全自动驾驶至关重要。
有多种技术可用于深度感知。如果要考虑深度性能,光探测和测距(激光雷达,LiDAR)是最佳选择。LiDAR能够以高深度和角度分辨率进行深度感知,并且由于系统通过近红外(NIR)激光与传感器的配合实现了主动照明,因此可以在所有环境光条件下工作。它既适用于近距应用,也适用于远距应用。虽然低成本的毫米波雷达传感器在当今的汽车应用中更为普遍,但它们缺乏LiDAR 的角度分辨率,无法提供超出基本ADAS 需求的更高级别自动驾驶所需的那种高分辨率三维点云环境信息。
最常见的LiDAR 架构是直接飞行时间(ToF)法,它通过发射一个短红外光脉冲,并测量信号从物体反射回到传感器所需的时间,从而能够直接计算出距离。LiDAR传感器通过在其视野范围内扫描光线来复制这一测量过程,以捕捉整个场景。
安森美的ARRAYRDM-0112A20 硅光电倍增管(SiPM)阵列是一种单光子敏感传感器,在单片阵列中具有12 个通道,在近红外波长如 905nm 处具有高光子探测效率(PDE),用于检测返回的脉冲。该SiPM 阵列已被集成到一款LiDAR 中,该LiDAR 安装在世界上首批提供真正“视线离开”的自动驾驶功能的乘用车上,使车辆具备了超越基础驾驶辅助的自动驾驶能力,即驾驶员可以不再关注路面情况。这种水平的自动驾驶功能,没有LiDAR 深度感知的支持,至今尚未能在消费级车辆上可靠地实现。
(3)超声波传感器
另一种用于距离测量的技术是超声波检测,即通过传感器发射频率超出人类听觉范围的声波,然后检测反弹回来的声音,从而通过飞行时间测量距离。
超声波传感器可用于泊车辅助等近距离障碍物探测和低速操控应用。超声波传感器的一个优点是声音比光慢得多,因此反射声波返回传感器的时间通常为几微秒,而光的时间为纳秒,这意味着超声波传感器所需的处理性能要低得多,从而降低了系统成本。
超声波传感器的一个例子是安森美NCV75215 泊车距离测量ASSP。在车辆停放过程中,该元件通过压电超声波变换器对障碍物的距离进行飞行时间测量。它可检测距离为 0.25~4.5m 的物体,并具有高灵敏度和低噪声等特点。
结语
安森美在开发ADAS 所需的传感器技术方面发挥了重要作用。安森美发明了双转换增益像素技术和HDR(高动态范围)模式,这些技术已经被业界许多传感器采用,并开创了创新的超级曝光设计,使传感器既能提供出色的低照度性能,又能通过单个光电二极管捕捉HDR 场景而不会出现饱和现象。由于这种市场和技术领导地位,因此目前道路上大多数ADAS 图像传感器都是由安森美开发的。这些创新使安森美能够在过去的二十年里为汽车应用提供高性能的传感器,进而使ADAS 在提高车辆安全方面发挥了重要作用。
汽车行业正持续大力投资于ADAS,并追求车辆全自动驾驶的目标——超越由SAE 定义的基本驾驶辅助功能(即L1 级和L2 级),迈向真正的自动驾驶能力(即SAE 定义的L3 级、L4 级和L5 级)。减少道路伤亡是这一趋势背后的主要动力之一,安森美的传感器技术将在这一汽车安全变革中发挥着至关重要的作用。可登录安森美官方网站(www.onsemi.cn/design/technical-documentation)了解ADAS 系统解决方案指南的更多信息。

成都国际工业博览会Chengdu International Industry Fair
创链新工业 共碳新未来
2025年4月23-25日
中国西部国际博览城
April 23-25, 2025
Western China International Expo City
www.cdiif.com

同期展会
Concurrent Exhibitions



工业自动化展数控机床与金属加工展新一代信息技术展新材料展节能与工业配套展
D三XPO上海工业商务展览有限公司东兰生合员 SHANGHAINDUSTRY&CONMERCEEXHIETIONCOLTD.
东浩兰生会展集团上海工业商务展览有限公司
电话Tel:021-22068388
CDllF@shanghaiexpogroup.com
Deutsche Messe汉诺威米兰展监(上海)有限公司汉诺威米兰展览(上海)有限公司电话Tel:021-50456700CDIIF@hmf-china.com
四川天府国际会展集团有限公司icnCbrupCoLd
四川天府国际会展有限公司电话Tel:028-80256232stex@cdtf.gov.cn
PENGCAN
四川鹏璨文化传媒有限公司
Siohuwn Fengan GulturMedis sLe
四川鹏璨文化传媒有限公司
电话Tel:028-67646118
CDIIF@pengcan.com
食品检测
机器视觉系统检测鳕鱼片中的寄生虫
采用高光谱成像和深度学习技术的视觉监测系统,能快速生成检测结果,足以满足工厂环境需求。
作者:Linda Wilson
在传统的鳕鱼鱼片寄生虫检测中,通常是让训练有素的员工,在有照明条件的工作台上手动检测,并用刀剔除寄生虫。这项工作需要精神高度专注和长时间站立,还需要一直重复单一的切除动作。这种检测方法,对去皮与带皮两种鱼片中寄生虫的检出率分别为 50% 和 25% 。
挪威的研究人员利用高光谱成像与深度学习技术相结合的检测系统,将鳕鱼片中寄生虫的检出率提高到了73% 。该系统算法具有 500fps 的吞吐量,其速度足以满足当前的生产需求。
挪威食品研究所Nofima AS 的研究人员在《科学报告》中写道,“鱼肌肉中的寄生虫,从质量以及健康和安全角度来说,给海产品行业带来了重大难题。但寄生虫与鱼组织之间的对比度很低,这使得寄生虫极难被检测出来。”
据研究人员称,大约一半的鳕鱼都存在一定程度的寄生虫感染,这些寄生虫被称为线虫,是一种微小的蠕虫状生物。
高光谱成像的优势
为实现这一流程的自动化,科学家们研究了高光谱成像技术的应用。该技术能够测量每个像素中的多种光波长,从而提供光谱信息和空间信息。然而,研究人员表示,直到最近,相关设备的运行速度仍过于缓慢,无法跟上生产线的节奏。

这项研究中的检测系统包含了一台Maritech Eye 设备,该设备集成了摄像头、数据处理单元以及交互照明系统(见图1)。
研究人员解释说,交互照明用于测量生物样本对光的吸收和反射情况,是识别寄生虫的关键环节,因为它能让使用者“看到”鱼体表面以下的情况。
Maritech 系统中的相机是挪威Norsk Elektro Optikk AS 公司的HySpexBaldur ~V~-~1024~N~ 相机。这款推扫式相机的光谱范围覆盖 485~960nm ,采用线扫方式采集图像。
训练和测试算法
为了测试该系统,研究人员在2020 年12 月至2022 年6 月期间,对葡萄牙一家工厂进行了三次访问,并收集了289 张标注好的鱼腹部位高光谱图像。随后,研究人员将这些图像划分为训练数据集(196 个样本)、验证数据集(49 个样本)和测试数据集(44 个样本)。图像中总共发现了244种寄生虫。
为创建这些数据集,工作人员对
鱼片进行了仔细检查,每个样本所花
费的时间比生产环境中的实际操作时
间长得多。他们从拍摄的高光谱图像
中提取RGB 数据来创建数字图像,
并使用iPad 在数字图像上标记寄生虫
的位置。研究人员使用Breeze 软件对
这些高光谱图像进行手动标注,该软下转第34页

高光谱成像
中波红外高光谱成像技术应对黑色塑料污染难题
MWIR高光谱成像技术克服了传统NIR系统和非光学分选方法识别黑色塑料的局限性,大幅提升黑色塑料的回收率。
作者:Minna Törmälä,Specim公司
塑料是日常生活中不可或缺的一部分,其全球年产量超过3.8 亿吨。在各类塑料中,黑色塑料因其功能及外观优势,在消费领域应用颇为广泛,因此在塑料总产量中的占比也很可观。同时,黑色塑料因其耐用性和耐磨性,广泛应用在汽车制造等高需求行业中。另外,在电子领域,它用于保护外壳、零部件等精密组件;在食品包装领域,它能隔离光线和氧气,从而起到食品保鲜的作用。
研究表明,黑色废弃塑料约占废弃塑料总量的 15% 。目前,因为回收设施中用于分选塑料的传统技术无法“识别”黑色,所以黑色塑料常常被误判,导致其回收率非常低。这些黑色塑料最终会被填埋或者焚烧,更糟糕的是可能会进入自然环境造成污染。
更为严格的法规正在各个地区实施,这些法规要求制造商在新产品中使用一定比例的再生塑料。例如,欧盟的《报废汽车指令(ELV)》规定,当一辆汽车不再使用时,其至少 85% 的重量应当被再利用或回收。这意味着回收后的材料可以被重新加工成新产品或者零部件,从而实现二次利用。此外,汽车至少 95% 的部分必须被重新利用或回收处理,这其中包括从无法回收的材料中获取能源等处理方式。另外,欧盟的《包装和包装废弃物指令》要求,到 2025 年, 50% 的塑料包装要被回收利用,到 2030 年这一比例需达到 55% 。要实现这些目标,需要有效的黑色塑料分拣方法。
塑料回收过程介绍
塑料回收过程需要多道工序。首先,需要将塑料从一般废弃物中收集和分离出来。塑料被分离出来后,会被送入粉碎机粉碎成更小的碎片,以便于后续处理。然后,清洗这些碎片以去除污垢、标签和其他污染物。最后,光学分选系统会按照聚合物类型对这些碎片进行分选,以确保每个种类只含有一种塑料树脂,这一过程对于生成高质量的再生材料至关重要。

光学分选机一般使用近红外(NIR)成像光谱技术,根据每种塑料独特的光谱特征来识别塑料种类。对于大多数塑料而言,该系统运行顺畅。然而,黑色塑料通常使用炭黑颜料着色,它几乎吸收了可见光和红外光谱中的所有光线,而没有光线反射,这使得近红外传感器无法识别出黑色。因此,黑色塑料碎片常常被误分选或当作垃圾丢弃,这不仅使回收率降低,还使有价值的材料被送往垃圾填埋场或焚烧炉。
另外,根据材料在水或其他流体中的密度进行分离的重力分选法,已被用作备用方案。虽然它能帮助分离出黑色塑料,但是这种方法也有两个缺点,一是该过程需要大量的水和化学品,资源消耗较大;二是重力分选的精度较低,导致回收塑料的纯度较低。
纯度不高的塑料通常会被降级回收,或转化为诸如石油类的替代产品,而较高纯度的回收塑料则更适合制造新的高质量材料。
中波红外(MWIR)高光谱成像技术能够实现对黑色塑料的精准识别与分选,为克服传统近红外和重力分选系统的局限性提供了解决方案。
高光谱成像在塑料分选中的优势和挑战
高光谱成像是一种将光谱学与成像能力相结合的先进技术。高光谱相机能够捕捉并分析不同材料具有的独特光谱特征,从而依据材料的化学成分而非大小、形状、颜色等视觉特征,实现精准的识别与分离。
高光谱成像(HSI)能够精确区分那些肉眼看起来相似的材料,比如不同种类的塑料。此外,高光谱成像支持实时处理,可实现快速、准确且自动化的分选。这使得它成为工业废物管理领域,尤其是塑料分选方面的一种强大且被广泛采用的解决方案。
高光谱相机在传送带上对材料进行高速扫描,分析其光谱数据,并运用先进算法对材料进行分选。随后,分选系统通过诸如空气喷嘴等装置,自动分离被识别出的各类塑料。

利用MWIR高光谱成像技术攻克黑色塑料分选难题
事实证明,MWIR 高光谱成像技术是解决黑色塑料分选难题的一种极为有效的方案,而NIR 成像技术则一直无法胜任。NIR 高光谱成像的光谱范围约为 900~2500nm ,相比之下,MWIR 高光谱成像拓宽了光谱范围,可以捕捉3~5\upmum 范围内高度详细的光谱数据。
在MWIR 波段范围内,各种塑料因其不同的分子构成而呈现出独特的光谱特征。因此,利用MWIR 波段的高光谱成像技术,有可能区分不同类型、不同颜色的塑料,甚至包括最难处理的黑色塑料。

实际应用和行业效益
严重依赖黑色塑料聚合物的行业,如汽车、电子和包装,从MWIR 高光谱成像这项先进技术中受益匪浅。例如,黑色塑料广泛应用于汽车行业的仪表板、保险杠和装饰部件。通过有效地分选这些材料,可以帮助汽车制造商实现回收目标,并减少汽车生产对环境的影响。
在电子行业,从智能手机到家用电器,黑色塑料外壳很常见。通过MWIR 高光谱成像技术,回收商能够有效地从废弃电子产品中分选出黑色塑料,帮助制造商满足日益严格的电子废弃物法规要求。
食品包装行业也有望从中获益。黑色塑料托盘常用于包装即食食品及其他食品。利用MWIR 高光谱成像技术有效地分选这些托盘,有助于减少这些托盘进入垃圾填埋场的最终数量。

图4:使用MWIR高光谱成像技术对黑色塑料、橡胶以及非黑色塑料和橡胶进行图像分选。
回收黑色塑料的环境与经济效益
对黑色塑料进行分选和回收,能带来显著的环境与经济效益。它使黑色塑料不被填埋或焚烧,从而减少环境污染,节约宝贵资源,向循环经济转型。在循环经济模式下,材料得以重复利用,这使得塑料垃圾处理的循环体系形成闭环。
从经济角度来看,制造商因黑色塑料回收节省了成本。在新产品中重复使用黑色塑料,减少了原材料的用量,从而降低了生产成本。此外,企业还能避免违反回收法规,从而免遭处罚。在日益注重环保的市场中,MWIR 高光谱成像技术因其具有的经济效益,成为企业保持竞争力的一个可行的选择。
与全球可持续发展目标相一致
将MWIR 高光谱成像技术纳入回收流程,不仅对各个行业有利,还与更广泛的全球可持续发展目标相一致。联合国可持续发展目标(SDG)强调减少废弃物并提高资源利用效率。MWIR 高光谱成像技术通过实现黑色塑料的高效回收,助力各行业遵守这些目标与相关规定。
已经有越来越多的国家实施生产者责任延伸(EPR)法规,这些法规要求制造商管理其产品的整个生命周期,
上接第31页
件是瑞典Prediktera AB 公司专为处理高光谱图像而设计的。
该算法同时整合空间信息和光谱信息来分析鱼片的高光谱图像,检测寄生虫是否存在及其位置。
如前文所述,研究人员得出结论:其自动化系统在检测寄生虫方面表现优于人工检查。他们还指出,用于训练算法的样本量若更大,检测率可能会提高。他们写道,“线虫的数量、大小、种类以及在鱼肌肉中的位置”更多样化,也会提高检测率。
包括处置和回收环节。在此种情况下,MWIR 高光谱成像技术将成为满足监管需求的重要工具。在已经实施法规的欧洲等地区,这项技术还可以为公司提供竞争优势。
基于MWIR高光谱成像的黑色塑料回收新时代
MWIR 高光谱成像技术在黑色塑料回收领域取得的成果,标志着黑色塑料回收技术的重大进步。这项创新技术克服了传统近红外系统和非光学分选方法的局限性。它能够对黑色塑料进行高效分选,有助于减少填埋废弃物,支持循环经济倡议,并与并与全球可持续发展目标相一致。
他们总结道:“这些结果对海产品行业具有重要意义。目前,每片鱼片都必须人工检查线虫。使用高光谱筛选后,只有那些被识别出有线虫的鱼片才需要送去修剪,并且带标注的高光谱图像可用于协助修剪人员去除寄生虫。这将显著降低劳动力成本,减轻修剪人员的负担。”
研究人员解释说,基于这项研究成果,冰岛一家鱼类加工厂的管理人员最近安装了一台Maritech Eye 设备,用于根据线虫的存在情况对鳕鱼片进行分类。
基于线光谱共焦技术的芯片贴片检测
芯片尺寸和引脚间距的缩小,对芯片贴片工艺以及封装基板和基座的制造精度提出了严苛挑战。贴片的位置偏差、封装基板的线路短路或断路、基座的表面平整度不佳等任何细微缺陷,都可能引发芯片性能下降甚至失效。同时,芯片制造过程中涉及的高反光、胶水等特殊材质样品的检测,也成为了行业内亟待攻克的难题。
贴片检测环节需要准确判断芯片贴片、封装基板和基座的表面形态、尺寸精度、以及是否存在缺陷等信息。

使用海伯森线光谱传感器LCF1000 从基板最左侧开始直线扫描,扫描整个基板多个检测区域并进行数据处理;通过扫描得到的灰度图、高度图以及3D 点云图像,可以直观判断芯片有无缺失/ 倾斜,引脚有无缺失;通过扫描后的3D 点云图像数据计算出基座面积、胶水爬坡高度、基板厚度以及芯片厚度。
对整个基板多个检测区域的图像数据进行处理,计算得出基座面积 1.909mm^{2} 、胶水爬坡高度 93.8\upmum 、基板厚度 192.6\upmum 、芯片厚度 165.6\upmum 。
HPS-LCF1000 可以满足对整个基板的外观扫描成像,从而可以计算得出芯片厚度、高反光基座厚度、胶水爬坡高度、芯片有无缺失等一系列信息。在芯片贴片、封装基板和基座的检测中展现出了卓越的性能和巨大的应用潜力。同时还解决了传统检测方式在遇到多种不同材质共同存在时的难题(如同时包含黑色吸光材质、高反光材质、透明材质等)。
视觉引导的机器人
视觉引导的机器人实现柔软鱼片的自动化整形
视觉引导的机器人结合精确的力控制技术,能够自动化处理鱼片等柔软精细食物的形状,解放劳动力。
文/Linda Wilson
美国加州Flexiv 是一家视觉引导机器人公司,该公司创建了一款自动化应用程序,可将裹着面包屑的鱼整理成均匀一致的外形(见图1)。

当初,这款应用程序是Flexiv 公司为一家亚洲海鲜加工公司创建的。这家海鲜加工公司的高管希望借助这款应用程序增加自动化程度以减少对人工的依赖,同时提高产量。
该公司于2024 年5 月安装了四台机器人,并在当月以全部产能运行该解决方案。2024 年晚些时候,该公司又增加了16 台机器人,使机器人总数达到20 台。
在部署自动化方案之前,员工需要手动整理鱼的形状,他们必须快速完成这项工作,同时又不能把鱼压得太紧以免造成损坏,因此这是一项令人筋疲力尽的工作。
“这项应用程序的独特之处在于,它实现了处理柔软且精细材料的自动化。一般来说,典型的自动化项目通常用于处理刚性材料,而处理食品,特别是鱼类,则需要非常精细的接触,这是传统协作机器人难以解决的问题,因为它们无法精确控制力度。然而,Flexiv 先进的力控制技术使我们能够以极高的精度处理这些精细的材料。”Flexiv新市场商业化解决方案总监Liang Mao 说。
视觉引导机器人的关键处理步骤
机器视觉系统被安装在传送带上方的一个定制外壳中,外壳内是一个集成的摄像头和嵌入式处理硬件。该过程的工序如下:
• 计算机视觉定位生产线上的每块鱼片。
• 视觉算法识别鱼片并确定其是否需要整形。
• 其他算法计算鱼片的整形顺序。
• 机器人结合力控制技术,对选定的鱼片进行整形。
机器人还使用生产线上方便拿取的专用工具,定期刮掉末端执行器上的食物残渣,以保持末端执行器的清洁。

Liang Mao 并未透露有关相机、照明和嵌入式处理硬件的细节。然而他补充说:“可以确定的是,光照变化不是我们算法的关键挑战,因为它是为处理动态光照条件而设计的。”
这是一种即插即用的解决方案,只需半天即可安装完毕,并且可以设计为在线或离线工作模式。该系统易于使用,没有机器人使用经验的人员也可以操作。工作人员可以通过按下红色按钮停止系统,也可以使用Flexiv 的软件监控生产过程(见图2)。
该款机器人不需要安装防护围栏,正如Liang Mao 解释的那样,“因为我们的自适应机器人具有全身力控制功能,5kHz 和1kHz 的响应率使它能比人类更快地感知到障碍物。这种超人的反应速度使机器人能够以反方向移动或立即停止运动来对障碍物作动态响应。”
精业锐志,极致创新!ITES 深圳工业展助力制造业开年起步即冲刺!


2025 ITES 深圳工业展以“精业锐志· 极致创新”为主题,将于3 月26 日至29 日在深圳国际会展中心(宝安)举办。扎根制造业25 载,ITES深圳工业展将为行业上下游打造了一个集技术交流和资源对接的专业平台。本届展会将演绎四大亮点,在开年之处助力制造业加速冲刺。
先进制造品牌聚集地
吹响 {}{2000+} 展商集结号
2025 ITES 深圳工业展设立8 大展馆,展示规模达16 万平方米。“金属切削机床展、金属成形机床展、机器人及自动化设备展、工业零件展、深圳医疗器械供应链生态展、深圳国际电子智能制造展、紧固件展”七大主题展示相互联动, {2000+} 家海内外工业品牌将聚焦“高端装备、精密制造、工业技术、智能制造”,集中呈现创新产品与落地应用。
今年展会内容聚焦“精密零组件生产制造”,全方位展示高端装备、机器人及自动化方案和精密制造的最新发展成果,助力工厂抢先一步触达前沿技术与创新应用。
金属切削机床、金属成形机床
本届ITES 深圳工业展上,山崎马扎克、牧野、GF 加工方案、罗德斯、北京精雕、创世纪、乔锋智能、科杰、埃弗米等展商,将针对高精度零部件加工,带来最新的解决方案与应用展示。
诸如百超迪能、大族激光、玛哈特激光、广天地数控、库迪二机、世翔精机、固泰科、奥盛激光等展商,将针对不同行业的板材生产需求,在ITES 上展示先进的激光加工智能化的生产设备,助力钣金厂实现生产效率与原料成本的双重优化。
机器人及自动化方案
作为智能制造行业重点关注的展会版块之一,机器人及自动化设备主题展将汇聚600 多家优秀企业,展出涵盖工业机器人、非标自动化设备、机器视觉、执行机构、仓储物流、工业控制、动力传动等内容,针对新能源及汽车制造、3C 电子及产品制造精密加工、医疗器械制造等行业,提供后段制程自动化及智能物流系列解决方案,同时为细分行业自动化设备提供各类零部件选型参考。

3月26 日至29 日,帕西尼、非夕、睿尔曼、因时机器人、宇立仪器、绿的谐波等人形机器人产业链龙头企业齐聚ITES,全面展示从六维力传感器、减速机、编码器、滚珠丝杠、执行机构等核心零部件到整机产品的最新技术成果,充分体现全产业链第一梯队汇聚现场的整合优势。ITES 深圳工业展从产业链出发,帮助人形机器人厂商解决供应缺口和量产落地的问题。
精密制造
工业零件主题展作为中国首个精密制造专题展,汇聚了近200 家精密零件加工优质企业,精通 CNC、冲压、钣金、铸造、塑胶、粉末冶金等多种工艺,能快速调整生产以满足小批量、多品种的非标定制加工,可针对医疗器械、民用航空、光学和仪器的精密零部件,高效响应客户的来图来样加工需求。
100+ 新品现场首发
热点技术前瞻
作为全球工业技术演进的核心观测站,2025 ITES 深圳工业展构建了一个高端设备的新品首发秀场。逾百项“全球首发、中国首发、华南首展”的创新成果重磅亮相,全面满足通用加工的高效生产目标,以及半导体、新能源汽车、AI 消费电子、医疗器械和低空经济等热门赛道的定制化加工需求,精准赋能企业实现“效能跃迁”与“降本提质”的双重目标。
500万像素CoaXPress接口工业相机UA5MAGCXP-111M/C
埃科光电推出500 万像素CoaXPress 接口工业相机UA5MAGCXP-111M/C,集高速传输、小巧灵活与稳定耐
用等优势于一身,搭载先进的背照式全局快门CMOS 图像

传感器,可实现高灵敏度、高画质;包含黑白和彩色两种图像模式;像元尺寸 2.74\upmum ,提供更清晰细腻的图像细节;支持高达6.25Gbps 的数据传输速率,能够实时传输大量图像数据,帧率最高可达111fps,轻松捕捉高速动态画面。支持四面安装,可轻松嵌入各类复杂工业设备与狭小安装空间,实现灵活布局与便捷安装。使用单根传输线即可同时进行供电、触发和取图,适应多样化的检测场景。
UA5MAGCXP-111M/C 适用于对相机帧率和数据传输速率有高要求的行业,如电子制造、汽车零部件生产、食品包装等的工业自动化检测。
埃科光电,www.i-tek.cn
3000KG“小金刚”系列搬运叉取型AMR
华睿科技推出“小金刚”系列D300 叉取型AMR,适配各类负载在 3000kg 以下的应用场景。特点如下:(1)

视觉辅助导航,轻松应对复杂环境:支持激光SLAM+ 视觉融合导航,显著提升定位
的准确性与稳定性,有效适配激光定位环境不佳的密集存储、巷道存取、提升机对接等复杂定位场景。(2)自主学习算法加持,全方位安全检测:标配四个激光传感器与两个3D 相机,可实现非接触式安全检测的全面覆盖。(3)多载具混合识别,智能自主适配:依托3D 相机或者激光传感器,具备对多种栈板进行混合识别的能力,适用于多种栈板类型、多种尺寸的栈板混合使用的仓储搬运环境。
D300 已经大批量应用于光伏双托组件、玻璃等原材料搬运,重工行业、汽车行业等各个行业物料转运等场景。
内置AI芯片的130万像素黑白相机Inspector8301
SICK 公司的Inspector 产品家族新增内置AI 芯片的130 万像素黑白2D 视觉智能相机Inspector8301,除了 具 备Inspector 系 列 产品的常规使用的质量检测(QualityInspection) 工 具集、基于AI 技术的深度学习(Intelligent Inspection)工具集、1.3M 像素的智能相机和强照明效果、直接网页显示的操作界面这些全部功能外,还拥有四核 CPU+AI 加速器、双端口ProfiNet 及EtherNet/IP 现场总线和高速I/O,速度提升明显。Inspector8301 主要包括相机本体、光学附件、线缆三部分,光学附件包含镜头、照明、保持器、光学保护罩四大块,本体上自带USB 调试接口、双端口ProfiNet 及EtherNet/IP 现场总线及8 个状态指示灯等等,友好直观的用户设置提升了用户体验。

Inspector83x 系列适用于汽车行业和家用电器(白色家电)、消费品行业、3C 行业、包装行业等应用场景。SICK,www.sick.com
CoaXPress 2.0 CXP-12高速接口相机SW-4000T-CXPA和SW-8000T-CXPA
JAI 推出两款配备了CoaXPress 2.0 CXP-12 高速接口的相机SW-4000T-CXPA 和SW-8000T-CXPA,每行R/G/B分辨率分别高达4096(4K)像素和8192(8K)像素,色彩成像表现出色。特性如下:(1)配备CoaXPress v2.0 接口,通过单根Micro BNC 电缆支持高达 12.5Gb/s 的数据输出速度。(2)接口支持电源供电和触发信号传输,可将相机无缝整合到多相机配置中。(3)在分光棱镜上的安装了三个CMOS 传感器,可将入射光分解为红、绿、蓝三个色波,确保优异的色彩精度。(4)传感器均采用双线排列设计,大像素元垂直/ 水平合并,提高光敏度和动态范围和信噪比。(5)可直接连接到旋转编码器,与传送带及其他运动
系统实现同步。用户还可以通过设置ROI 来提高相机的扫描速率,以16 像素为步长将行宽和

面向光谱分析的线阵背照式CMOS图像传感器GLR1402BSI-M
长光辰芯推出专门面向光谱分析应用而开发的线阵背照式CMOS 图像传感器GLR1402BSI-M,特性如下:
(1)更低读出噪声,更高动态范围:该芯片最低读
出噪声仅为1.4e-,可以有效识别色散后较弱的光信号;采

用了双增益HDR 技术,使其单幅动态范围达到50000:1(94dB),准确记录光强特性和色散特性,具有更高的光谱分辨率。
(2)更宽光谱响应,探测范围更广:针对在紫外及可见光谱段进行优化,其在 200~300nm 区间的平均量子效率近 60% 。芯片可通过采用定制化ARC,进一步提升量子效率。
(3)更快行频,数字输出:采用片上12bit/14bit 两种数字输出,简化了用户后端开发,同时支持Sub-LVDS 和并行CMOS 两种输出接口,用户可根据后端平台自由选择。
适用于各类基于光谱分析的应用领域,如生物制药、食品安全、医疗健康、化学分析、工业检测等。
长光辰芯,www.gpixel.com
CXP接口MARS-251-1938X2M/C和MARS513-940X2M/C
大恒图像推出两款产品:火星系列CXP 接口MARS-251-1938X2M/C 和MARS-513-940X2M/C。火星MARS-251-1938X2M/C 采用Gpixel-GSPRINT4502 全局曝光CMOS 传感器,具有 1938fps{\omega}2048x1216 超高帧率,信噪比达到45dB,极小曝光时间 1\upmus ,支持硬件HDR 功能(可定制),适合高帧率高速飞拍应用。火星MARS-513-940X2M/C 采用定制款芯片,达到 940fps{\omega}2560x2016 的超高帧率,信噪比高,像元大,达到 9\upmum ,具有优秀的满阱、灵敏度和量子效率。两款相机均通过CoaXPress 接口进行图像数据的高速传输,相机传输速度快、传输稳定性高、功耗低、输出图像质量清晰。

大恒图像,www.daheng-imavision.com
新版Imaging Control IC4软件
The Imaging Source 映美精相机推出最新版的ImagingControl IC4 SDK 和GenTL GigE&USB3 Vision 驱动程序,为在.NET 6 或更高版本、Python、 C{+}+ 或C 等编程语言中开发提供强大的支持,支持Linux \mathbf{x}86 、Linux ARM 和

Windows 平 台的开发,可以在不同的操作系统上无缝工作。这种跨平台的能力极大地提
高了开发的灵活性和效率,助力客户能够更快地将产品推向市场。
映美精,www.theimagingsource.com
人加®散料运输动态监测与预警系统
人加机器人推出软硬件一体化智能散料运移动态监测与预警系统,护航全场景散料运输,助力多行业生产效率提升。该系统包括司眸 ^{({{R}}}GBD 智能相机、智能料流检测软件、监测管理平台。核心优势:
(1)高精度测量和数据稳定输出:精度可达毫米级,测量结果与实际物料流量误差小于 5% ;支持深度数据和RGB 数据同步对齐输出。

(2)超大景深和超宽
视野:可测量输送带宽度达
3m ,测量料堆高度达 1.5m 。(3)部署简单、安装便
捷:无需改变现场环境就能快速安装,且调试简便,系统易于维护。
(4)端侧AI,架构简洁:具备数据传输延迟更低、无需额外工控机计算设备,节省安装与维护成本。
适用于煤矿热电、砂石骨料、粮食谷物、金属矿石、烟草烟叶等应用场景。
人加机器人,www.humanplustech.com
2.45亿像素XoFLink光口相机 MV-CH2450-10Q1M/Q1C
海康机器人推出全新2.45 亿像素XoFLink 光口相机MV-CH2450-10Q1M/Q1C,采用Sony IMX811 传感器,具备低噪声和高动态范围的特点,分辨率 19200x12800 ,
像元尺寸 2.81\upmum ;支持Binning、多组LSC轮询、逐像素点校正等ISP 功能;采用XoFLink 高速传输接口,配合光模块可达

到50G 的最大带宽和 150m 的传输距离,在方案复杂度和传输稳定性以及响应速度上相比CoaXPress 和CameraLink,XoFLink 都有明显优势;内置TEC 主动制冷模块,大幅降低Sensor 温度,保证长曝光下的图像质量;符合XoFLink 自研协议和GenlCam 标准。
适用于FPD 检测、PCB AOI 天文测绘、铁路等相关应用。
海康机器人,www.hikrobotics.com
高速高分辨率微距线扫3600DPI微距相机
苏映视推出高速高分辨率微距线扫成像产品3600dpi微距相机,特点如下:
(1)高速高精度: 7\upmum 像素尺寸,配合 11mm 物距的镜头,实现高精度卓越成像。

(2)无漏失:整行无缝隙,图像
无缺失。独有的图像校准、融合算法,确保精确的图像融合和过渡,出厂前已标定和校准。
(3)高速度:最高 {200}kHz 行频、10GigaE 接口,实现长距离、可靠的数据传输。
(4)All-In-One :一体化工业设计,集成光源调节、焦距调节机构,装调更方便。
适用于对多幅拼接、空间要求紧凑、装调维护便捷等有苛刻要求的细分场景。
苏映视,www.insnex.com
新一代光谱共焦位移传感器FD 系列
湾测技术推出新一代光谱共焦位移传感器FD 系列,特点如下:
(1)超高采样频率,实时在线检测:控制器的采样频率可达33kHz ,可以对高速移动、高速转动或高速振动的物体进行可靠的实时在线测量。

(2)纳米级超高精度,准确测量精细形状: ± 48° °检测角度探头,搭配可编码器输入的控制器,能精准测量精细形状和轮廓,实现纳米级超高精度测量。
(3)多种型号控制器可选,适用复杂场景:新增高速型、标准型和经济型控制器,搭配多种规格探头,满足不同的产品应用需求。
(4)电缆保护结构,使用寿命长:不锈钢光纤电缆保护结构,方便安装,耐弯折,延长线缆使用寿命。
适用于极片厚度检测、晶圆平面度检测、曲面玻璃轮廓检测、摄像头模组行程检测。
结构光焊接专用3D相机Epic Eye Pixel Welding
迁移科技推出结构光焊接专用3D 相机Epic Eye PixelWelding,内置强大成像芯片,输出高分辨率点云数据。
采用蓝色条纹结构光,在0.5~0.7m 内精度可以达到± 0.1mm 。结构光技术通过高亮度DLP 投影机投射光栅并分析其变形来获取物体的三维信息,可以针对不同材质、不同反射特性的工件生成高质量亚毫米精度的点云数据,具有扫描速度快、成像清晰、定位精准等优势,并且可以在更大范围内获取物体的三维信息。

相机体积小,重量轻,功耗低。具有成像速度快、易于机器人末端集成等特点,可搭配多种型号焊接机器人,满足工件定位与识别、多机协作焊接、焊缝识别等场景需求,可应用于船舶、桥梁、建筑钢结构、汽车零部件等行业生产线焊接作业。
迁移科技,www.transfertech.cn
AI赋能智赢未来
AI大模型在智能制造中的应用
2025年5月 肥 苏州•狮山国际会议中心
伴随着2022 年ChatGPT 的横空出世,AI 大模型开始蓬勃发展,Gemini、文心一言、Copilot、LLaMA、SAM、SORA 等各种大模型如雨后春笋般涌现,特别是去年,杭州深度求索人工智能基础技术研究有限公司推出DeepSeek,更是引起人们对AI 大模型的高度重视,AI 大模型正赋能千行百业。
同样,在智能制造领域,AI 大模型也在引领一场革命。无论是在研发设计、生产规划、质量管控、生产制造、还是物流供应链、营销服务等各个产业链环节,工业AI 大模型都能在降本增效、提升产品质量、提升技术成熟度和标准化、增强决策支持、数据安全和隐私保护等方面大显身手。可以说智能制造领域才是AI 大模型的主战场。
为此,《工业AI》(AIM)将在5 月在苏州STCon 大会上举办“AI 大模型在智能制造中的应用” 主题研讨会,诚挚的邀请行业内专家以及同业人员参会。
探讨议题 (拟定) | |
AI大模型+工业软件推动自主创新 | AI大模型提升制造业的数据安全和保护 |
AI大模型赋能制造业的生产控制与监测 | AI大模型让技术融合更快更高效 |
AI大模型与边缘计算的融合 | 构建“公共云+AI”的体系化能力,引领智能制造新阶段 |
AI大模型让机器人更智能 | AI大模型推动制造业全环节全链条智能化 |

AI 大模型:开启智能制造新纪元
AI 大模型正在重塑全球制造业的竞争格局。作为新一代人工智能技术的集大成者,AI 大模型展现出强大的理解、推理和生成能力,为智能制造注入了新的发展动能。在工业4.0的浪潮下,AI 大模型与智能制造的深度融合,正在开启制造业数字化转型的新篇章。
AI 大模型在智能制造领域的应用价值主要体现在三个方面:首先,通过海量数据训练,AI 大模型能够精准识别生产过程中的异常情况,实现质量检测的智能化升级。其次,AI大模型具备强大的知识推理能力,可以优化生产排程,提高设备利用率,降低能源消耗。最后,AI 大模型支持自然语言交互,使得人机协作更加顺畅,大幅提升生产效率。
在具体应用场景中,AI 大模型展现出显著优势:在预测性维护方面,通过分析设备运行数据,AI 大模型可以准确预测设备故障,将非计划停机时间减少 50% 以上;在工艺优化方面,AI 大模型能够快速处理复杂的工艺参数,找出最优生产方案,将产品良率提升 30% ;在供应链管理方面,AI 大模型实现了需求预测、库存优化和物流调度的智能化,显著降低了运营成本。
展望未来,AI 大模型与智能制造的融合将不断深化。随着技术的进步,AI 大模型将实现更精准的工业知识表示和推理,推动制造业向自主决策、自适应生产的方向发展。同时,AI 大模型也将加速制造业服务化转型,催生新的商业模式和产业形态。在这个充满机遇与挑战的新时代,把握AI 大模型带来的技术红利,将成为制造企业制胜未来的关键。
为此,《工业AI》(AIM)将在5 月在苏州STCon 大会上举办“AI 大模型在智能制造中的应用”主题研讨会,诚挚的邀请行业内专家以及同业人员参会,让我们齐聚金鸡湖畔,共话“智能制造中的AI 大模型”。
AI 大模型与智能制造的结合,不仅是技术的革新,更是制造业发展理念的升级。这场变革将重塑全球制造业的竞争格局,推动制造业向更高效、更智能、更可持续的方向发展。在这个充满可能性的新时代,AI 大模型正在书写智能制造的新篇章。
《工业AI》编辑部
AI 大模型迈向多模态,助力具身智能与机器人实现创新
作者:马健 Arm 物联网事业部业务拓展副总裁
你听过莫拉维克悖论 (Moravec's paradox) 吗?该悖论指出,对于人工智能 (AI) 系统而言,高级推理只需非常少的计算能力,而实现人类习以为常的感知运动技能却需要耗费巨大的计算资源。实质上,与人类本能可以完成的基本感官任务相比,复杂的逻辑任务对 AI 而言更加容易。这一悖论凸显了现阶段的 AI 与人类认知能力之间的差异。
人本来就是多模态的。我们每个人就像一个智能终端,通常需要去学校上课接受学识熏陶(训练),但训练与学习的目的和结果是我们有能力自主工作和生活,而不需要总是依赖外部的指令和控制。
我们通过视觉、语言、声音、触觉、味觉和嗅觉等多种感官模式来了解周围的世界,进而审时度势,进行分析、推理、决断并采取行动。
经过多年的传感器融合和 AI 演进,机器人现阶段基本上都配备有多模态传感器。随着我们为机器人等边缘设备带来更多的计算能力,这些设备正变得愈加智能,它们能够感知周围环境,理解并以自然语言进行沟通,通过数字传感界面获得触觉,以及通过加速计、陀螺仪与磁力计等的组合,来感知机器人的比力、角速度,甚至机器人周围的磁场。
迈入机器人和机器认知的新时代
在 Transformer 和大语言模型 (LLM) 出现之前,要在 AI 中实现多模态,通常需要用到多个负责不同类型数据(文本、图像、音频)的单独模型,并通过复杂的过程对不同模态进行集成。
而在 Transformer 模型和 LLM 出现后,多模态变得更加集成化,使得单个模型可以同时处理和理解多种数据类型,从而产生对环境综合感知能力更强大的 AI 系统。这一转变大大提高了多模态 AI 应用的效率和有效性。
虽然 GPT-3 等 LLM 主要以文本为基础,但业界已朝着多模态取得了快速进展。从 OpenAI 的 CLIP 和DALL * E,到现在的 Sora 和 GPT-4o,都是向多模态和更自然的人机交互迈进的模型范例。例如,CLIP 可理解与自然语言配对的图像,从而在视觉和文本信息之间架起桥梁;DALL * E 旨在根据文本描述生成图像。我们看到Google Gemini 模型也经历了类似的演进。
2024 年,多模态演进加速发展。2024 年二月,OpenAI 发布了 Sora,它可以根据文本描述生成逼真或富有想象力的视频。仔细想想,这可以为构建通用世界模拟器提供一条颇有前景的道路,或成为训练机器人的重要工具。三个月后,GPT-4o 显著提高了人机交互的性能,并且能够在音频、视觉和文本之间实时推理。综合利用文本、视觉和音频信息来端到端地训练一个新模型,消除从输入模态到文本,再从文本到输出模态的两次模态转换,进而大幅提升性能。
在2024 年二月的同一周,谷歌发布了 Gemini 1.5,将上下文长度大幅扩展至 100 万个词元 (Token)。这意味着 1.5\;Pro 可以一次性处理大量信息,包括一小时的视频、11 小时的音频、包含超过三万多行代码或 70 万个单词的代码库。Gemini 1.5 基于谷歌对 Transformer 和混合专家架构 (MoE) 的领先研究而构建,并对可在边缘侧部署的2B 和 7B 模型进行了开源。在五月举行的 Google I/O 大会上,除了将上下文长度增加一倍,并发布一系列生成式AI 工具和应用,谷歌还探讨了 Project Astra 的未来愿景,这是一款通用的 AI 助手,可以处理多模态信息,理解用户所处的上下文,并在对话中非常自然地与人交互。
作为开源 LLM Llama 背后的公司,Meta 也加入了通用人工智能 (AGI) 的赛道。
这种真正的多模态性大大提高了机器智能水平,将为许多行业带来新的范式。
例如,机器人的用途曾经非常单一,它们具备一些传感器和运动能力,但一般来说,它们没有“大脑”来学习新事物,无法适应非结构化和陌生环境。
多模态 LLM 有望改变机器人的分析、推理和学习能力,使机器人从专用转向通用。PC、服务器和智能手机都是通用计算平台中的佼佼者,它们可以运行许多不同种类的软件应用来实现丰富多彩的功能。通用化将有助于扩大规模,产生规模化的经济效应,价格也能随着规模扩大而大幅降低,进而被更多领域采用,从而形成一个良性循环。
Elon Musk 很早就注意到了通用技术的优势,特斯拉的机器人从 2022 年的 Bumblebee 发展到 2023 年三月宣布的 Optimus Gen 1 和 2023 年年底的 Gen 2,其通用型和学习能力不断提高。在过去的 6 至 12 个月里,我们见证了机器人和人形机器人领域所取得的一系列突破。
下一代机器人和具身智能背后的新技术
毋庸置疑的是我们在具身智能达到量产方面还有很多工作要做。我们需要更轻便的设计、更长的运行时间,以及速度更快、功能更强大的边缘计算平台来处理和融合传感器数据信息,从而做出及时决策和控制行动。
而且我们正朝着创造人形机器人的方向发展,人类文明数千年,产生出无处不在的专为人类设计的环境,而人形机器人系统由于形体与人们类似,有望能够在人类生存的环境中驾轻就熟地与人类和环境互动并执行所需的操作。这些系统将非常适合处理脏污、危险和枯燥的工作,例如患者护理和康复、酒店业的服务工作、教育领域的教具或学伴,以及进行灾难响应和有害物质处理等危险任务。此类应用利用人形机器人类人的属性来促进人机自然交互,在以人为中心的空间中行动,并执行传统机器人通常难以完成的任务。
许多 AI 和机器人企业围绕如何训练机器人在非结构化的新环境中更好地进行推理和规划,展开了新的研究与协作。作为机器人的新“大脑”,预先经过大量数据训练的模型具有出色的泛化能力,使得机器人能做到见怪不怪,更全面地理解环境,根据感官反馈调整动作和行动,在各种动态环境中优化性能。
举一个有趣的例子,Boston Dynamics 的机器狗 Spot可以在博物馆里当导游。Spot 能够与参观者互动,向他们介绍各种展品,并回答他们的问题。这可能有点难以置信,但在该用例中,比起确保事实正确,Spot 的娱乐性、互动性和细腻微妙的表演更加重要。
Robotics Transformer:机器人的新大脑
Robotics Transformer (RT) 正在快速发展,它可以将多模态输入直接转化为行动编码。在执行曾经见过的任下转第45页
HeterogenousMultimodalSystemsforRobotics
The brains forrobotics are heterogenous for performance, efficiency, safety and security

工厂里的机器人:支持 5G 的 AMR 如何提高效率
作者:Embedded Computing Design 编辑部
自主移动机器人(AMR)正在改变工作方式,从工厂车间的重复性任务到医疗保健、零售、农业等领域的操作。
自动移动机器人 (AMR) 设计用于在制造设施和仓库等动态环境中自主导航并执行定位和处理库存等任务。与依赖固定路径或外部制导系统的自动导引车(AGV)相比,自动移动机器人具有更多功能,它使用传感器、摄像头和人工智能驱动的技术(如同步定位和映射(SLAM))进行动态导航,避开障碍物并适应不断变化的环境。这提供了更大的灵活性和更高的效率。
为什么要采用 AMR?
AMR 可以缓解传统工厂面临的一些挑战,包括劳动力短缺、效率低下和运营成本高昂。它们的停机时间几乎为零,而且可以让人类工人专注于价值更高的活动。AMR 的一个优势领域是材料处理,这是一项劳动密集型工作,而且容易出错。
AMR 还可以接手危险和体力要求高的任务,如在繁忙区域搬运重物或运输材料,从而提高工人的安全性。通过最大限度地减少人类在危险任务和环境中的参与,AMR 降低了受伤风险,从而创造了一个更安全、更高效的工作场所。
加入 5G
在工业环境中,WiFi 通常用于操作自主移动机器人 (AMR)。然而,WiFi 经常面临干扰、范围有限和网络拥塞等挑战,从而降低了通信效率。将 5G WiFi 与 AMR 结合使用可解决这些限制,并提高整体性能。5G具有超低延迟、更高带宽和更广覆盖范围等关键优势。这使 AMR 能够更高效地处理来自传感器和摄像头的实时数据,提高与其他系统和设备的协调能力。总体而言,5G WiFi 有助于确保 AMR 系统的连续运行、更好的车队协调和更高的可扩展性。
AMR 已经投入使用
自主移动机器人凭借其灵活性和与现有基础设施轻松集成的能力,在制造、仓储和物流环境中正迅速获得青睐。最近的一个例子是华硕物联网与全球领先的工业嵌入式系统和解决方案提供商 Portwell 合作,在台湾开发了一个支持 AMR 的 5G AIoT 智能工厂。双方的合作取得了令人瞩目的成果,包括仓库物流准确率超过 99% ,并且无需三名物料搬运人员。
此前,Portwell 的仓库运营需要多达 10 名员工每天上午和下午两次手动处理材料准备和运输工作。任务包括清点物料、将物料装入托盘、使用液压车将物料运送到生产线,以及将成品从生产车间运送到仓库储存或装运。这些活动横跨仓库和生产区的三个楼层。


由于通过定制的 5G 专用网络实施了华硕物联网仓库控制系统,波特威尔的 AMR 现在能够利用先进的避障和动态重定向功能,在包括狭窄通道和多层操作在内的复杂环境中进行导航。现在,仓库人员可以通过中央显示屏专
上接第43页
务时,谷歌 DeepMind 的 RT-2 较上一代的 RT-1 表现一样出色,成功率接近 100% 。但是,使用 PaLM-E(面向机器人的具身多模态语言模型)和 PaLI-X(大规模多语言视觉和语言模型,并非专为机器人设计)训练后,RT-2具有更出色的泛化能力,在未曾见过的任务中的表现优于 RT-1。
微软推出了大语言和视觉助手 LLaVA。LLaVA 最初是为基于文本的任务设计的,它利用 GPT-4 的强大功能创建了多模态指令遵循数据的新范式,将文本和视觉组件无缝集成,这对机器人任务非常有用。LLaVA 一经推出,就创下了多模态聊天和科学问答任务的新纪录,已超出人类平均能力。
正如此前提到的,特斯拉进军人形机器人和 AI 通用机器人领域的意义重大,不仅因为它是为实现规模化和量产而设计的,而且因为特斯拉为汽车设计的 Autopilot 的强大完全自动驾驶 (FSD) 技术基础可用于机器人。特斯拉也拥有智能制造用例,可以将 Optimus 应用于其新能源汽车的生产过程。
未来机器人技术的基石
Arm 认为机器人脑,包括“大脑”和“小脑”,应该是异构 AI 计算系统,以提供出色的性能、实时响应和高能效。
机器人技术涉及的任务范围广泛,包括基本的计算
注于实时监控,加强质量控制并优化生产。此外,该系统还能自动记录物料数量、行进路线和时间数据,准确、实时地了解库存情况。
华硕与 Portwell 合作开发的这一支持 5G 的智能工厂解决方案成功提高了效率,有助于推动利润增长。
光明的未来
毫无疑问,在不久的将来,支持 5G 的 AMR 将成为许多公司采用的解决方案。它将带来诸多益处,并将继续增长。然而,这些支持 5G 的解决方案并不局限于制造环境,它们也是医疗保健(供应运输)、零售(店内库存跟踪)、农业(作物监控)等领域的理想选择。(译自EmbeddedComputing Design)
(比如向电机发送和接收信号)、先进的数据处理(比如图像和传感器数据解读),以及运行前文提到的多模态LLM。CPU 非常适合执行通用任务,而 AI 加速器和 GPU可以更高效地处理并行处理任务,如机器学习 (ML) 和图形处理。还可以集成图像信号处理器和视频编解码器等额外加速器,从而增强机器人的视觉能力和存储/ 传输效率。此外,CPU 还应该具备实时响应能力,并且需要能够运行 Linux 和 ROS 软件包等操作系统。
当扩展到机器人软件堆栈时,操作系统层可能还需要一个能够可靠处理时间关键型任务的实时操作系统(RTOS),以及针对机器人定制的 Linux 发行版,如 ROS,它可以提供专为异构计算集群设计的服务。我们相信,SystemReady 和 PSA Certified 等由 Arm 发起的标准和认证计划将帮助扩大机器人软件的开发规模。SystemReady 旨在确保标准的 Rich OS 发行版能够在各类基于 Arm 架构的系统级芯片 (SoC) 上运行,而 PSA Certified 有助于简化安全实现方案,以满足区域安全和监管法规对互联设备的要求。
大型多模态模型和生成式 AI 的进步预示着 AI 机器人和人形机器人的发展进入了新纪元。在这个新时代,要使机器人技术成为主流,除了 AI 计算和生态系统,能效、安全性和功能安全必不可少。Arm 处理器已广泛应用于机器人领域,我们期待与生态系统密切合作,使 Arm 成为未来 AI 机器人的基石。
增强自主移动机器人的安全性
作者:Theo Kersjes 安森美系统工程经理
如今,机器人已引入工业设施,用于帮助提高生产力,提升效率。在工业 4.0 向工业 5.0 过渡的进程中,工业制造商一直在积极利用人工智能等先进技术,努力提高竞争力,同时聚焦以人为本的策略和可持续发展。企业为了追求更高的效率和质量,纷纷寻求增强人机交互,这一趋势大大促进了自主移动机器人(AMR)的广泛应用。
AMR 需要综合的软硬件系统,才能与现代制造或仓储设施中的操作员协同工作。机器人会产生较大的冲击力且移动速度较快,因此可能会带来一定的风险,例如在意外碰撞中导致工人受伤。我们必须谨慎管控此类风险,不仅要制定相关的操作流程,还要注重机器人本身的设计。

如何设计出能安全有效地与人类协作的 AMR 系统,需要考虑哪些关键要素?本文进行了探讨。我们将分析安森美(onsemi)的先进解决方案如何作为 AMR 子系统的基本构建模块,为设计人员提供了既提高生产力又不影响安全性的有力工具。
自动化与人类并肩成长
工业机器人的广泛应用始于 20 世纪 60 年代的计算机时代,截至目前,估计有 340 万台工业机器人在投入使用中。过去二十年来,数字技术进步催生了能够在复杂环境中导航并与团队合作完成任务的协作型移动机器人。
随着工业自动化从工业 4.0 向工业 5.0 发展,人机交互水平将进一步推动对 AMR 的需求,预计到 2030 年,
AMR 的市场价值将在 2022 年 10.2 亿美元的基础上增长两倍,达到 31.3 亿美元。(图 2)。

AMR 成本效益高、易于部署,并且可以与操作员协同工作,实现比单独工作更好的效果。例如,协作机器人在速度、准确性和一致性上表现出色,成为焊接和装配线工作等重复性任务的理想选择,从而使工人可以专注于需要更高认知技能的更复杂任务。
传统的固定机器人可以与人物理分隔开来,以防止人员受伤,在引入了共享工作空间的概念后,新的挑战随之而来。AMR 必须能够感知突如其来的外力并在必要时快速停止运动。尽管在工作场所与人和物体发生碰撞难以避免,但机器人必须能够减少冲击以防止人员受伤和物品损坏。对此,机器人设计师可以利用传感技术和视觉系统的进步来克服这些挑战,并将机器人的力量和精度与人的创造性问题解决能力更紧密地结合起来。
AMR 中的关键子系统
AMR 使用多个传感器、人工智能和先进算法与环境交互,从而做出决策、检测障碍物并与操作员和其他机器安全协作。
下方的功能框图(图 3)展示了 AMR 系统的典型设计,其中的基本子系统包括运动控制、传感、照明、电源、充电及通信。

在本文中,我们将重点关注传感、电机控制和照明子系统。
传感子系统
传感器使机器人能够适应所在的操作环境,并根据实时数据做出决策。传感器有多种类型,包括成像、超声波、红外、电感和惯性传感器,旨在增强机器人的导航能力和安全性。为应对装载坡道等复杂环境,可能需要用到多种不同类型的传感器,此时就需要通过传感器融合来合并多个传感器的数据。
安森美 AR0234CS 是一款先进的全局快门图像传感器,可生成非常清晰、锐利的数字图像。这款传感器经过优化,采用了创新的像素设计,能够以每秒 120 帧的速度准确、快速地捕捉移动场景,并在弱光和强光场景下产生清晰的低噪点图像。AR0234CS 能够捕获视频流和单帧,是 AMR 等广泛工业应用的理想选择。
AR0234C 只是安森美众多先进的传感器之一,安森美广泛的产品组合中还包括 ARRAYRDM-0112A20-QFN,这是一款用于单点 LiDAR 系统的准一站式解决方案。NCV75215 超声波传感器采用低成本的 ToF 测量技术,测量范围为 0.25 米至 4.5 米,是 AMR 应用的明智之选。
运动控制子系统
机器人必须能够进行重复且精确的运动。大多数运动部件(包括机械臂和牵引系统)都依赖于由复杂算法控制的无刷直流(BLDC)电机。通常,BLDC 由变频驱动器(VFD)控制,后者使用 MOSFET、IGBT、栅极驱动器和二极管等分立元件。功率集成模块(PIM)和智能功率模块(IPM)提供更高的集成度,减少了元器件数量并节省了空间。
安森美提供众多分立元件和模块,其中包括NCD83591 电机驱动器,这是一款易于使用的 60\;V 多用途三相栅极驱动器,具有高增益带宽电流检测放大器,非常适合机器人电机控制。这款栅极驱动器采用小型 QFN28( 4x4 毫米)封装,具有高集成度,特别适合 BOM 整体优化。
安森美提供的电感式位置传感器 NCS3210 和NCV77320,用于运动控制系统,以测量车轮或其他运动部件的旋转。
照明子系统
照明技术用于照亮通路,帮助 AMR 导航和操作,并通过发信号和指示灯来表明自身的状态和意图,从而与其他人员和设备进行通信。选择 LED 照明技术的原因在于它在亮度、色温和功耗方面的表现出色。LED 照明解决方案可以使用多种组件来构建,包括但不限于 LED 驱动器、降压或升压转换器和功率 MOSFET。
LED 控制器和驱动器组件负责监控 LED 内的电流,使 LED 发出特定强度和波长的光线。LED 驱动电路使用高边和低边功率 MOSFET 来导通或关断 LED 电流,并保护 LED 免受过压和过电流条件的影响,从而确保 LED 驱动电路的稳定性。NCV7685 具有 12 个线性可编程恒流源,使用相同的基准电压,支持 128 个不同的可调 PWM 占空比级别。这款线性 LED 驱动器用于 LED 的调节和控制,非常适合 AMR 和汽车应用。
结论
不同于以往与人分隔开的机器人,最新一代的机器人必须能够安全地与人协作并防止人员受伤和物品损坏。新一代机器人解决方案正在改变众多行业,包括制造业、电子商务、医疗卫生和运输业,这些行业面对巨大的竞争压力,必须在提高效率的同时,保障质量和安全不受影响。新一代灵活且可定制的机器人旨在与人一起协作,执行有精确度要求的重复性任务,帮助人转而专注于更高价值的活动。
微软如何利用动态少镜头技术优化NLP 模型
作者:Eleanor Hecks Designerly杂志主编
自然语言处理(NLP)是一种强大的人工智能(AI)应用。它支持像 ChatGPT 这样的下一代聊天机器人,让普通大众也能使用先进的机器学习功能。然而,训练 NLP模型是一项挑战。
训练一个人工智能算法使其足以在现实世界中使用,需要花费大量的时间和数据。一种名为 “少量提示”(few-shot prompting)的技术提供了一种更好的解决方案,微软最近公布了一种进一步改进 “少量提示 ”方法的方法。
什么是少量提示?
在要求人工智能模型提供自己的最佳输出之前,“少量提示 ”学习会向其提供最佳输出的示例或 “镜头”。数据科学家通过加入少量标记数据点或理想答案格式,帮助算法以更快的速度学习。因此,在几乎所有任务类型中,该技术都能持续提高准确率。
除了提高准确率外,少量提示还能使模型具有多功能性。由于模型学会了将示例应用于新任务,因此它们获得了更广泛的应用能力,可以利用现有知识解决新问题。这种方法还能减少训练所需的数据量。
尽管有这些优点,但 “少量学习 ”也有一些缺点。虽然准确率往往会随着实例的增加而提高,但包含过多镜头会导致提示过大。当这些提示过大时,训练速度就会减慢,元学习(即模型将所学应用于其他场景的能力)也会降低。

微软的最佳少量提示方法
为了解决这些问题,微软最近推出了一种动态的少量提示方法。这种新方法为模型提供了一个包含大量示例的数据库。每当用户提出一个问题,算法就会将其与该数据库进行比较,找出最相关的例子,并将其应用到答案中。
创建这样一个数据库可能需要时间,但它简化了培训和使用过程。人工智能解决方案无需用户提供多个示例,而是从现有的镜头中找出最适合该场景的镜头。因此,不再需要处理冗长、复杂的提示,但准确性和元学习潜力依然很高。
除了提高模型的准确性和效率外,少镜头动态提示还能降低成本。算法必须分析的提示数据越多,处理费用就越高。考虑到目前有 63% 的高管认为成本是他们采用生成式人工智能的最大障碍,因此通过更简单的提示来降低成本是一项非常有益的策略。
动态少量提示 NLP 模型的应用
在模型需要完成多种任务的情况下,动态少量提示最有优势。目前,人工智能最大的一些应用案例就属于这种情况。
·商业智能
商业智能(BI)通常涉及复杂的报告,可以从优化的少量学习中获益良多。虽然 81% 的企业信任他们的人工智能输出,但依赖不准确或表现不佳的模型平均每年会导致 4.06 亿美元的损失。
由于动态少量提示提高了人工智能的准确性和多功能性,因此可以避免此类结果的发生。领导者可以要求它分析绩效、总结报告或绘制未来增长图,模型将适应每项任务,而不会在它们之间混淆示例。因此,商业智能解决方案在各种用途上都变得更易于使用和信任。
·教育
这些算法的灵活性还有助于实现个性化,这在教育领域尤为重要。在传统的一刀切高等教育体系中,近三分之一的学生会在大二之前辍学。为每个学生量身定制教材可以取得更好的学习效果,而这需要适应性强的人工智能模型。
少量学习有助于人工智能解决方案适应不同学生的需求。更高的元学习能力意味着该技术能更好地将过去的信息应用到新的场景中,使其成为超个性化环境的理想选择。
·客户支持
64% 的现代企业认为,人工智能将改善客户支持,下转第50页