电子说
谷歌正在开发各种人工智能技术,其中包括一个通用语音模型,这是该公司试图建立一个可以理解世界上1000种最常用语言的模型的一部分。
有传言称,除了计划在今年的年度 I/O 活动中展示20多款人工智能产品外,谷歌正在朝着构建支持1,000种不同语言的人工智能语言模型的目标迈进。在周一发布的更新中,谷歌分享了有关通用语音模型 (USM) 的更多信息,该系统被谷歌描述为实现其目标的“关键的第一步”。
去年11月,该公司宣布计划创建一个支持1,000种世界上使用最广泛的语言的语言模型,同时还展示其 USM 模型。谷歌将 USM 描述为“最先进的语音模型家族”,有20亿个参数,经过1200万小时的语音和280亿个句子的训练,涵盖300多种语言。
USM 已被 YouTube 用于生成隐藏式字幕,它还支持自动语音识别 (ASR),支持自动检测和翻译语言,包括英语、普通话、阿姆哈拉语等。
目前,谷歌表示 USM 支持100多种语言,并将作为构建更广泛系统的“基础”。另外,Meta 也正在开发一种类似的 AI 翻译工具,该工具仍处于早期阶段。
审核编辑 黄宇
全部0条评论
快来发表一下你的评论吧 !