合合信息技术亮相VAlSE2023,AI破解版面分析与还原难题获业内关注
2023-08-02 09:04:29爱云资讯631
VALSE (Vision And Learning Seminar)是一个面向计算机视觉与机器学习领域国内外华人青年学者的高规格学术研讨会。
2023年度VALSE 于近日圆满落幕,会议由中国人工智能学会、中国图象图形学学会主办,江南大学和无锡国家高新技术产业开发区管理委员会承办。超五千名专家学者、知名高校师生以及来自合合信息等科技企业的研发人员齐聚大会,共探计算机视觉、图像处理、模式识别与机器学习前沿技术的发展与应用。
本届会议专注于视觉知识和多重知识表达、语言文字识别与理解等技术研发及应用热点。文档的智能化处理是计算机视觉在产业中的重要应用方向,现阶段还面临着诸多挑战。
作为智能文档处理技术领域的代表企业,合合信息出席会议并进行智能文档处理技术研发与实践成果分享。
VALSE Workshop环节,合合信息技术代表就《智能文档图像处理技术应用与实践》主题进行分享
分享提到文档中通常含有大量的图片、表格等非文字内容,一篇普通的论文或者文稿,除文字信息外,其版面往往包含页眉、页脚、表格、二维码等多种元素。在向系统输入文档图像后,机器会对文字部分和版面元素进行分析和识别,把若干行文字关联起来,从而获得正确的顺序与段落关系,这便是版面分析技术。
版面分析的任务目标被分为物理版面分析和逻辑版面分析两类,前者主要解决区域分割问题,后者则关注区域之间的逻辑关系或阅读顺序。在实际文档图片的格式转化流程中,在检测、识别完出文字信息中的字符、坐标信息,以及版面中段落、印章、表格等元素信息后,机器才能“理解”文档的组成,更好地将图像“还原”成一个可编辑的Word或Excel文件。如果无法提升版面分析的精准度,文件材料在被拍照、扫描成电子文档的过程中便可能出现漏字、错位的现象。
合合信息“智能文档处理——文档还原系统架构”展示
合合信息版面分析技术通过解决版面分割、区域间的逻辑关系处理等方面的难题,可将文档图像切分成不同类型内容(文本、图形、公式、表格等)的区域,并分析区域之间的关系,让机器更精准地确定文档中的文字位置、字体、大小和排版方式,从各类版式复杂的图片文档中精准获取信息。
随着OCR技术应用面的持续拓宽,复杂多变的版面、多样化的文本内容给文档的识别和还原带来了新的挑战。“版面分析与文档还原”技术对提升文档图像电子化的视觉效果、信息提取精准度非常关键,是合合信息重点发力的技术方向之一。
相关文章
- 网安标委2024年“标准周”活动顺利举行,合合信息AI助力图像鉴伪技术创新
- CCF-CV携手合合信息打造技术分享论坛,聚焦大模型时代中的视觉安全前沿热点
- 用AI“读懂”专业文档资料,合合信息助力出海企业规避侵权“陷阱”
- 解决文档应用开发“水土不服”问题,合合信息智能文档处理“百宝箱”亮相1024程序员节
- 做好个人信息保护“守门员”,合合信息入选首批PIA典型案例集
- 中国信通院携手合合信息发布《文本图像篡改检测系统技术要求》
- 合合信息:破解大模型语料库难题的引领者
- 合合信息AI技术赋能财务业绩解读
- 推进上市新阶段 合合信息为高效学子搭建桥梁助力“金点子”落地
- 合合信息科创板IPO上市 专注于人工智能及大数据科技
- 合合信息IPO 以技术做桥梁助推学术成果转化
- 合合信息上市:专注人工智能及大数据科技,C端产品月活过亿
- 合合信息旗下启信数据发布AI行业全景洞察,促进新质生产力发展
- 合合信息发行:以用户需求为研发导向,提升企业核心竞争力
- 合合信息IPO发行:启信慧眼精准圈定优质科企,排查隐形关联交易
- 扫描全能王母公司合合信息,古籍修复技术助历史文脉赓续