弯曲矫正、PS篡改检测、去摩尔纹、水印去除…图像处理“黑 ...
OCR技术作为起步较早、发展较为成熟的人工智能技术领域,当前仍存在着文档图像质量退化严重、文字检测及版面分析困难、非限定条件文字识别率低、结构化智能理解能力差等亟待解决的问题。OCR技术的进阶之路上,文档图像质量的增强是重要的研究方向,需克服页面弯曲、阴影遮挡、摩尔纹、图片模糊等现代文本图像处理中常见的干扰状况。合合信息基于自研的计算机图形图像技术,推出多种图像智能处理引擎,可实现图像切边增强、形变矫正、PS篡改检测、去摩尔纹、水印去除、阴影处理、手写文字擦除、图像质检等多种图像智能处理效果,规范图像采集,提升图像质量,帮助各应用领域简化下游文档处理任务,通过图像预处理提升文字识别效率与准确性。
切边增强
智能判断图像中的主体边缘并切除多余背景,同时通过增强锐化提升图像质量、突出文字。
应用场景:业务材料审核与归档
当采集的业务材料图像存在着多余背景、主体过小、角度倾斜等问题时,通过合合信息的切边增强技术,可自动裁切出图像主体区域,并增强图像质量,经过该项处理后再进入后续的文字识别、信息提取、材料审核等业务,在票据识别、文本转录、电子化归档等场景中,都具有广泛应用。
弯曲矫正&透视矫正
手持镜头拍照得到的文档图像往往存在着复杂的几何形变,包括拍摄视角、纸张本身的折叠、褶皱、弯曲以及厚度等因素,都会造成拍摄图像存在畸变。
合合信息采用基于位移场网络学习方法的系统构架,可对形变文档进行智能矫正,包括弯曲矫正与透视矫正,同时智能定位文档边缘,切除多余背景。
应用场景:纸质文档/书籍/曲面文字的扫描与电子化
为了便于纸质文档与书籍的备份、存档、共享、识别、检索,常常通过拍摄的形式将其扫描与电子化。依托合合信息的图像形变矫正技术与图像增强能力,可将手机、相机等设备拍摄的文档、书籍图像优化为如同平面扫描仪获得的图像。而对于本身就存在于弯曲载体上的文字(例如钟鼎文),通过弯曲矫正技术,可自动“拉平”图像,提升各类非常规载体文字的识别效率与质量。
PS篡改检测
合合信息自研了基于深度学习的图像篡改检测方法,采用神经网络模型捕捉图像在篡改过程中留下的细微痕迹,基于百万级的数据学习图像被篡改后统计特征的变化,可智能判断图片是否被篡改,支持检测复制粘贴、拼接、擦除等多种篡改形式与混合篡改,还可定位修改区域,以热力图形式展示图像区域篡改置信度。
应用场景:反欺诈审查
在保险理赔、银行移动开户、信用卡申办,以及商业消费场景中,每年都会因欺诈带来巨大的资金损失与潜在风险。依托合合信息PS篡改检测技术,可智能判断用户上传的证件、票据、文档等材料是否存在篡改,并显示篡改区域与篡改置信度,助力反欺诈审查。
去摩尔纹
使用相机拍摄电子屏幕,图像上会出现呈现条状、网状、波纹状等多种形态、颜色各异的摩尔纹(也称为屏幕纹)。合合信息采用多重神经网络技术,通过分析暗角、摩尔纹的形成原理,对图像中存在的干扰因素进行对应处理,可去除所有样式的摩尔纹,同时保证图像信息完整、颜色不失真。
应用场景:工厂流水线质检监控
工厂中往往会有机械设备的屏幕显示仪器数据运作指标,以往在质检等环节中需要手抄来记录。将合合信息的去摩尔纹技术引入流水线监控流程中,即可实现数据的“随拍随录”,质检员拍摄仪器屏幕,图像去摩尔纹后便于进行精准的数据识别、提取、自动录入。
水印去除
合合信息基于全卷积网络搭建图像水印去除模型,支持对图像中日期、logo、文字等形式的水印进行自动擦除,高保真处理,无痕还原图像。
应用场景:自动化审核预处理
水印的存在是为了保护图片版权,但是过大、过多的水印往往遮挡重要信息,在材料自动化处理过程中,容易导致无法识别、信息提取不完整等情况,需要人工介入与辨识。在金融业务中,许多网站下载的证明材料自带水印,自动化审核困难。通过合合信息的水印去除技术,可自动擦除材料水印,还原被覆盖的信息,提升文字识别与提取的准确率。
阴影处理
智能消除图像中存在的各类形状的阴影,解决图像因光线条件复杂产生的有阴影、亮度不均匀问题。
应用场景:材料采集上传
在基层员工、用户自行拍摄材料上传系统的业务场景中,常常由于室内光线特点(顶灯照射)导致材料上落下阴影,遮挡部分文字内容,造成信息识别困难。通过合合信息阴影处理技术,可智能消除图像中的阴影,提升材料规范性与后续的识别准确性。
手写文字擦除
融合了内容切分、手写字迹分离网络、文档质量增强等技术,将待处理图像划分为手写的“擦除区域”和印刷的“非擦除区域”,快速识别与自动擦除手写文字,并对噪点、阴影、背景杂乱等复杂场景进行处理,将文档图像恢复至手写前的状态。
应用场景:教育领域文档处理
在教育场景中,为了整理错题集、试卷再次书写、组卷,需要将试卷、作业本等文档进行多次利用。通过合合信息的手写文字擦除技术,可擦除试卷等文档上的手写字迹,一键恢复至未书写状态,该技术可集成于打印机、学习机,扫描或拍摄试卷后调用擦除字迹能力。
图像质检
智能判断图像是否内容完整、拍摄清晰、光线充足等,对图像质量进行自动化的准入判断与实时反馈。
应用场景:前端页面上传证件
随着在线业务实名制的普及,用户在银行开户、移动支付、投保理赔等多个场景下都需要自行在移动端上传身份证进行实名认证。引入合合信息图像质检技术,可以在前端页面即实现对用户上传图像在线质检与反馈结果,如图像不符合审核要求,实时反馈用户,提醒用户重新拍摄。
页:
[1]