供企业以OCR(Optical Character Recognition)技术快速处理文件的Google人工智能组件Document AI,Google现在更新其OCR引擎,加入三个预览功能,使Document AI现在可评估文件光学品质,支持数字PDF,还让用户能够控制OCR版本。
Document AI为一个人工智能组件,能够理解和组织文件,该组件由Document AI Workbench、Document AI Workbench Warehouse和一组预训练文件处理器所组成,使用户能够利用OCR技术,从各种类型的文件截取文本。Document AI使用来自Google云计算以及Google研究院团队所开发的机器学习模型,能够处理非结构化文件截取文本和段落等布局,并涵盖200多种语言。
Document AI OCR引擎第一个更新功能,是针对页面层级的智慧文件品质(IDQ)评估。官方提到,OCR引擎让用户以程序开发方法,截取重要文件特征,包括词频、项目相对位置、文件的主要语言等,使其能够用于下游业务处理,而新的智慧文件品质评估功能,更提供了另一个重要的文件评估信号。
IDQ含模糊、小字体、眩光等八个维度页面品质指标,Google提到,通过识别文件的光学品质,将有助于用户根据文件品质进行不同处理,进而使整个文件处理流程更加高效。
第二个新功能,是Document AI开始支持数字PDF文件。PDF格式常被用于采购、贷款和合约等应用程序,PDF分为证件扫描等图片形式,以及可供复制粘贴和突出显示文本的数字形式。而现在Document AI OCR完全支持数字PDF文件,代表着该服务能够截取和来源文件完全相同的文本和符号。
由于Google会定期升级Document AI OCR所使用的机器学习模型,虽然新模型带来新功能,但也可能改变OCR行为,因此Google现在加入了OCR版本控制,让用户能够冻结OCR模型行为,确保OCR的行为一致。对于有严格法遵要求的产业,OCR版本控制也有助于维持相同的模型版本,最大程度减少版本间重新认证堆栈的工作量,通过OCR版本控制让企业可以灵活选择适合业务需求的版本。