AI+语音创造新价值

电子说

1.3w人已加入

描述

到目前为止,您可能已经为Enterprise Connect 2019填写了评论,并且考虑到会议令人印象深刻,广泛的报道随处可见。EC19已经结束了,但我在这里有一篇观点文章,你不会在其他任何地方看到它,而且它只是松散地与该事件有关。

语音技术是EC19更有趣的主题之一--而不仅仅是因为我谈到了它--如果你想知道都谈到了什么,我有两个不同的例子可以分享,那是我为我的演讲所做的研究。

像其他任何事情一样,这个主题只有在以某种方式思考它时才有意义。我通过解释人工智能(AI)和语音是如何在非常不同的轨迹上的两个不同主题来开启我的演讲。人工智能是超级大肆宣传的,最热的话题,并且同时是面向各个方向的。没有重心,每个供应商都在尝试加入人工智能元素或人工智能赋能--无论销售什么。其中一些努力将取得成果,一些将悄然消失--语音是人工智能轨道的合理应用之一。

另一方面,语音技术非常成熟,迄今为止主要是功能性的,与音频转录和语言翻译有关的用例。现在,想象一下维恩图(Venn Diagram)和两者之间的重叠空间,这就是我看到新价值具有潜力的地方。AI是语音识别的新转折,由于各种原因,它将事物提升到一个全新的水平。

除了在语音准确性方面做出渐进但非常明显的改进之外,AI还将语境,意图,情感等带入等式,并提升语音的价值,实际上是用于协作等用例。这是一个单独的主题,对于这篇文章而言,我只想用我在演讲中提到的具体例子来说明发生了什么。

Otter.ai--Seeing is Believing-实时转录

我之前已经引用过这个例子,但它也适用于这篇文章。Otter.ai是AI Sense的独立产品,是实时转录产品的领先示例,我认为它很快将成为协作平台的标准功能。经常转录是在事实发生之后,但实时是在当下,并且正在成为使会议更具包容性的一种方式。

除了不必记笔记--因此在会议期间有更多的参与--这还有助于听力受损或无法跟随英语演讲的参与者与其他人保持同步。考虑与多文化参与者会面,其中英语不是母语,但也要考虑具有强烈口音的发言者,即使是讲英语的参与者也很难跟随。

我很厚颜无耻,但是在这里我想到的是Austin Powers的这个场景,当时他正在和他的爸爸一起玩耍。不仅是英语口音很大,甚至说英语的人都需要字幕,但是还有一层俚语解码--而这是另一个AI问题,我确信Otter的人们都在努力工作加以实现。

回到协作环境,实时转录和实时翻译的结合创造了另一个引人注目的用例。这种情况的变化已经存在了一段时间,我们在微软的EC19主题演讲中看到了一个很好的例子。单独地,这些功能中的每一个都令人印象深刻,但是当你展示它们一起工作时--正如微软所做的将一位中国演讲者的演讲翻译成英语一样--这是非常神奇的。

然后是AI部分,这是很多新价值的来源。Otter's Teams应用程序允许使用扬声器标记,并且所有文本都可搜索,很容易找到一个人说话的所有地点,甚至是两个特定人互相交谈的地方,或添加搜索词以便随时查找正在讨论转录中出现的这个词。搜索的可能性是无穷无尽的,这使得转录成为会议的有力增值项。

其他重要功能包括自定义语言参考,以便转录引擎能够准确地跟踪您的行业或特定项目的特定术语或缩略词。Otter。ai与大多数主要协作平台集成,因此它是您已经使用的增值服务。还有双因素身份验证可确保您的工作空间的安全性,特别是对于那些远程加入会议的人来说,他们的身份难以确定。

这些功能非常酷,但除非转录准确性很高,否则它们都不重要--不仅仅是为了阅读,还有实际上当你真正付出最多的注意力时。对于Otter.ai而言,准确性是一种自豪感--就像我一直在谈论的每个语音文本播放器一样--如果你看看该团队的背景,那么你一定相信血统论的正确存在。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分