4月24日消息 日前有报道称,谷歌产品经理Sagar Savla近日在北京举行的视频电话会议中向与会媒体介绍了一项旨在通过自动字幕技术减少现实世界中的对话障碍的免费Android服务——“Live Transcribe”!感兴趣的朋友,不妨来了解一下。
据悉,通过自动语音识别技术 (ASR),计算机能够检测有声语言并将其现场转录为供阅读的文本,由Google云提供技术支持,Live Transcribe可以进行实时的对话字幕转录,支持超过70种语言,覆盖全球80%以上的人口。
Sagar Savla表示,虽然依靠云ASR能为我们提供更高的准确性,但Google希望可以减少Live Transcribe所需的网络流量消耗。为此,Google在先前AudioSet的工作基础上,实现了基于神经网络的设备语音检测器。该网络是一种图像式模型,类似于我们之前发布的VGGish模型,它可以检测语音并自动管理与云ASR引擎的网络连接,将长时间使用过程中的数据流量消耗降至最低。
据了解,Google曾考虑了几种不同的模式:计算机、平板电脑、智能手机、小型投影仪,以迭代方式显示听觉信息和字幕。
软件使用量热度图
最终,Sagar Savla的团队决定专注于智能手机模式,因为这类设备无处不在且功能日益强大!另外,世界卫生组织曾预计到2055年全球将有九亿人听力受损,而谷歌的这项软件可以为他们带去便利,且该软件在亚洲已非常流行。