首先关注一个核心问题:什么场景下的OCR识别需求分别对应选择什么型号智能相机,以及是否需要深度学习?
一、字符识别
对于一些产线产品位置固定,OCR 特征清晰明显,对比度高、背景简单的字符,可 以通过传统方式即阈值分割的形式进行读取的需求,相机字符识别自带的模型可以应对 现场如点阵、刻蚀、压印出来的字符。自带的模型内部已经训练了几百万张样本,基本涵盖了绝大部分应用场景。
二、特征匹配(位置修正)+字符识别
对于一些产品在视野内可能位置会变动、产品位置不固定但前景和背景灰度差较大、干扰较少的实际场景,可以开启位置修正对字符识别进行辅助定位,来保证产品移动、旋转等各种情况下都可以定位到要识别的字符。
注:开启位置修正后,需保证模板区域始终在相机视野内,否则特征匹配不到会持续NG。
三、DL 字符识别
在一些字符形态大小不统一,对比度低,背景存在干扰,字符粘连,畸变等场景, 传统方法效果一般,这个时候可以用到深度学习,在常见行业如,食药品包装,电子行业,烟草行业薄膜,半导体晶源等等已经实现全行业覆盖,不需要进行过多的模型训练,就可以实现字符的高效识别检测,准确率基本在三个九以上。
四、DL字符定位+DL字符识别
在很多实际的OCR检测需求中,字符位置不固定,字符大小不统一,甚至一些需求仅检测视野内某个特定区域内的字符,应对这类情况,往往需要深度学习定位和深度学习识别搭配起来使用,提高准确率和稳定性达到预期效果。
食品行业喷墨会导致字符大小、深浅、形态和位置都会有变化,传统方法无法准确定位到字符,引入深度学习定位和深度学习识别有效解决难题。
面对仅检测红框内字符(出界即NG)的实际需求,传统算法模块无法实现检测需求,引入深度学习定位进行辅助,定位框框选目标区域,搭配出界过滤使能完美解决应用难点。
外包装行业需要对箱体喷墨进行OCR识别,字符位数、长短、大小、位置及拍照距离都存在变化,且应对字符分段、喷墨深浅不一、存在划痕等干扰,深度学习都可以稳定定位并识别。
OCR识别仍然是智能相机的主要应用方向之一,关于OCR识别的优化和更新也是智能相机的重点迭代方向,智能相机会结合市场需求和建议不断优化算法库以适应并解决愈发多样性的检测场景和任务
广州艾韦迅科技是海康威视HIKVISION旗下的海康机器人HikRobot海康智能读码器/工业相机经销商,供应海康扫描枪ID2000、ID3000、ID5000、ID6000等系列全部型号,海康威视HIKVISION读码器同时为 为电子、物流、FPD显示屏、半导体、汽车制造等领域提供专业机器视觉解决方案,海康工业读码器助力用户快速准确实现工业自动化。