谷歌推出免费Android服务,面向听力残障人士,支持超过70种语言

电子工程师 2019-04-29 2714

电子说

1.4w人已加入

描述

近日，谷歌邀请媒体在京举行视频电话会议，谷歌产品经理Sagar Savla介绍了Live Transcribe软件，这是一项免费的Android服务，通过将自动字幕技术融入日常会话，减少现实世界中的对话障碍。

据了解，通过自动语音识别技术 (ASR)，计算机能够检测有声语言并将其现场转录为供阅读的文本，由Google云提供技术支持，Live Transcribe可以进行实时的对话字幕转录，支持超过70种语言，覆盖全球80%以上的人口。

Sagar Savla表示，虽然依靠云ASR能为我们提供更高的准确性，但Google希望可以减少Live Transcribe所需的网络流量消耗。为此，Google在先前AudioSet的工作基础上，实现了基于神经网络的设备语音检测器。该网络是一种图像式模型，类似于我们之前发布的VGGish模型，它可以检测语音并自动管理与云ASR引擎的网络连接，将长时间使用过程中的数据流量消耗降至最低。

在技术呈现方面，Google曾考虑了几种不同的模式：计算机、平板电脑、智能手机、小型投影仪，以迭代方式显示听觉信息和字幕。最后，Sagar Savla的团队决定专注于智能手机模式，因为这类设备无处不在且功能日益强大。

资料显示，世界卫生组织预计，到2055年全球将有九亿人听力受损。谷歌的这项软件可以为他们带去便利。目前该软件在亚洲已经非常流行。

打开APP阅读更多精彩内容