Android的实时声音转录文本工具可以识别低语或是狗吠

在等待Android Q的实时字幕功能之前,其实Google也有在测试一个实时的声音转录文本的Live Transcribe工具,用途是针对协助听障人士获得外界的信息。今天Google宣布要为这app加入识别环境声音事件的功能,同时也加强了复制和存储内容的能力。


就如上面示意图所描述,当这app收录到低语或是狗吠,就会在画面下方显示相关的图标,让用户可以得知那是由人或是环境音所来的声音。同时,因应这声音转录文本工具也可以给学生或记者来作记录之用,所以也加入了更方便的文本选取和复制方式。

Google表示他们为了让全球18亿台合资格的Android设备使用这功能,是主要通过云计算的机器学习和语音识别功能驱动这app,无需因为机器的硬件配置受限。

科技巨头都在积极开发更强大的语音识别和转换工具,为的自然是给日后人类与机器之间有更好的交互体验,尤其是让AI能有更接近真人的自然交流能力。