微软发布具有图形接口的计算机视觉工具Vision Studio,让用户可以在不需要技术基础下,探索、评估并且展示计算机视觉功能,官方提到,用户可以试用和探索计算机视觉服务,并在决定要部署后于自己的应用程序中,应用微软所提供的客户端函数库和REST API。
针对图像和视频的分析、管理需求,微软提供了计算机视觉API,供用户能够以高端算法处理媒体,并且取得需要的资讯,用户只要上传媒体资产,或是指定媒体URL,Azure的计算机视觉服务就能以各种算法,以符合适户需求的方式分析视觉内容。
而Vision Studio可让用户在没有技术支持下,快速地试用该计算机视觉服务。在Vision Studio中,每个计算机视觉功能都有一个或多个试用功能,用户可以使用自己的图像进行测试,不过这项操作需要拥有Azure订阅和认知服务资源以进行身份验证,要在不登录的情况下使用Vision Studio,则可以使用微软所提供的范例图像进行测试。
Vision Studio提供光学字符识别(OCR)功能,供用户从图像以及文件中,截取印刷或是手写文本。Vision Studio也能够进行空间分析,识别视频里存在的人物以及人物的移动,并且产生其他系统可以回应的事件。用户也可以将Vision Studio用于人脸识别应用,以侦测、识别和分析图像中的人脸,官方提到,人脸识别的用途非常广泛,包括身份验证、非接触式访问控制和隐私脸部模糊等都用得上。
Vision Studio的图像分析功能则可从图像中,截取许多视觉特征,包括对象、脸部、成人内容,甚至是自动生成文本描述以改进无障碍功能,用户可以在Vision Studio中,尝试使用自己的图像,以准确识别对象、内容,并且替图像生成图说。