美国伊利诺大学香槟分校(University of Illinois Urbana-Champaign,UIUC)本周发布了语音无障碍项目(Speech Accessibility Project),并宣布该项目已取得了来自Amazon、苹果、Google、Meta与微软等五大科技企业,以及其它非营利组织的支持,以让语音识别能够包容更多样化的语音模式,造福更多的残障人士。
主导该项目的UIUC电子暨计算机工程教授Mark Hasegawa-Johnson表示,能够利用语音与设备交流或操作设备,对数字经济时代的任何人都是重要的,语音接口应该支持所有人,包括残障人士在内。
Hasegawa-Johnson指出,这是一个困难的任务,因为它需要庞大的基础设施,最好是得到由领先技术企业所支持的基础设施,因此他们已经创建一个跨学科的团队,邀请了语言学、语音AI、安全及隐私等各方面的专家,以协助面对该挑战。
该项目的源由来自于现代的语音识别系统有所不足,例如语音助理或翻译工具并不总是能识别那些障碍人士的各种语音模式,像是渐冻人/硬化症、帕金森氏症、脑性麻痹或唐氏症,不管是这些或其它社群的许多人,可能都无法自最新的语音识别工具中受益。
由于科技企业可借由人工智能与机器学习技术,来提供更具包容性的语音办识能力,语音无障碍项目即负责搜集代表这些不同社群的语音样本,研究人员计划付费招募志愿者来贡献语音样本,创建一个匿名的资料集,以用来训练机器学习模型,让各种模型更能理解不同的语音模式,且初期将锁定美国英文。
除了五大科技企业都同意在技术上支持该项目之外,专门帮助帕金森氏症病患的Davis Phinney Foundation,及患硬化症的前美式足球员Steve Gleason也都承诺将支持该项目。