Google强化Document AI OCR引擎，加入文件光学品质评估功能

供企业以OCR（Optical Character Recognition）技术快速处理文件的Google人工智能组件Document AI，Google现在更新其OCR引擎，加入三个预览功能，使Document AI现在可评估文件光学品质，支持数字PDF，还让用户能够控制OCR版本。

Document AI为一个人工智能组件，能够理解和组织文件，该组件由Document AI Workbench、Document AI Workbench Warehouse和一组预训练文件处理器所组成，使用户能够利用OCR技术，从各种类型的文件截取文本。Document AI使用来自Google云计算以及Google研究院团队所开发的机器学习模型，能够处理非结构化文件截取文本和段落等布局，并涵盖200多种语言。

Document AI OCR引擎第一个更新功能，是针对页面层级的智慧文件品质（IDQ）评估。官方提到，OCR引擎让用户以程序开发方法，截取重要文件特征，包括词频、项目相对位置、文件的主要语言等，使其能够用于下游业务处理，而新的智慧文件品质评估功能，更提供了另一个重要的文件评估信号。

IDQ含模糊、小字体、眩光等八个维度页面品质指标，Google提到，通过识别文件的光学品质，将有助于用户根据文件品质进行不同处理，进而使整个文件处理流程更加高效。

第二个新功能，是Document AI开始支持数字PDF文件。PDF格式常被用于采购、贷款和合约等应用程序，PDF分为证件扫描等图片形式，以及可供复制粘贴和突出显示文本的数字形式。而现在Document AI OCR完全支持数字PDF文件，代表着该服务能够截取和来源文件完全相同的文本和符号。

由于Google会定期升级Document AI OCR所使用的机器学习模型，虽然新模型带来新功能，但也可能改变OCR行为，因此Google现在加入了OCR版本控制，让用户能够冻结OCR模型行为，确保OCR的行为一致。对于有严格法遵要求的产业，OCR版本控制也有助于维持相同的模型版本，最大程度减少版本间重新认证堆栈的工作量，通过OCR版本控制让企业可以灵活选择适合业务需求的版本。