SpeakIn推出全球首款专用于声纹识别的AI芯片和模组

cMdW_icsmart 2018-01-16 9455

电子说

1.4w人已加入

描述

在此次的CES2018展会上，众多厂商纷纷发布了自己最新的技术和产品。毫无疑问，人工智能（AI）是此次CES展会的一大热点。NVIDIA公布全新的用于自动驾驶的AI芯片Xavier SoC；瑞芯微也发布了自己的首款AI芯片RK3399Pro；联发科宣布推出NeuroPilot AI平台，主打跨平台终端人工智能。与此同时，国内专注于声纹识别领域的初创公司SpeakIn的声纹识别芯片及模组也被曝光。而这也将是全球首款专用于声纹识别的AI芯片和模组。

据了解，SpeakIn推出的这款声纹算法模组集成了一颗微处理器，内存，双路ADC和硬件降噪，前端AGC自动增益控制，硬件音频编码译码器和WiFi 802.11 ac。更为关键的是，其中还集成了40GFlops声纹验算单元，搭载了SpeakIn的声纹模型库，可以在离线状态下实现本地化的智能采集和验证，更为快速和便捷。当然，如果是在线状态下，还可连接SpeakIn云平台，进行声纹大数据检索与比对，动态声纹数据同步，提供端+云的全方位解决方案。

此外，SpeakIn的这款声纹算法模组在接口方面也比较齐全，不仅集成了主流GPIO和高保真音频接口，还支持千兆以太网。

可以说，SpeakIn推出的这款声纹算法模组就是一个完整的可独立运行的支持声纹识别的小电脑，并且具备通用扩展性和前向支持能力。同时，整个模块的功耗也非常低，据说仅2Wh。此外，模块的体积也比较小，而且模组的尺寸和高度也是因为集成了内存芯片和嵌入了许多接口，而在实际应用中，这些接口是可以嵌入在硬件设备上的，所以模组的尺寸和高度都是也是可以根据需要进行调整的，非常便于集成。

我们都知道，为了推动语音识别的应用，众多的语音识别厂商此前都有联合芯片厂商推出自己的语音识别模组，或者推出自己的麦克风阵列方案，以提升语音识别的体验，而这些动作也确实加速了语音识别市场的发展。同样，随着SpeakIn的这款声纹识别模组的推出，也或将加速声纹识别的普及应用。

声纹识别将成语音人机交互的最佳身份认证方式

随着语音/声学以及人工智能技术的发展，语音已经被认为是下一代人机交互关键技术（交互更简单，更自然）。目前亚马逊、苹果、谷歌等海外巨头，以及国内的阿里、百度、腾讯等众多厂商都推出了自己的智能音箱产品，并且都集成了自己的智能语音助手。在此次的CES展会上，集成智能语音助手的设备可谓是随处可见，可以预见语音交互将成为未来最为重要一种人机交互方式，与此同时声纹识别技术也开始焕发出了新的生命。

首先，不论对于智能音箱这样的家用设备，还是智能手机这样的私人设备，用户隐私及安全都是必须要考虑的问题。而在单纯的通过语音交互的场景之下，传统的指纹识别、虹膜识别，乃至于新的人脸识别等用于保护用户隐私及安全的生物认证方式并不适用，也不便捷。比如我们对智能音箱说，“帮我来定个昨天中午一样的外卖”，如果有了声纹识别作为身份认证方式，那么你通过这一句话就能够完成整个订餐及支付操作。如果没有声纹识别，那么到了支付环节，可能还是需要通过智能手机上的指纹识别/人脸识别来完成认证的步骤，这显然很麻烦。当然，我们也可以通过语音读出密码的方式来完成，但是这显然不利于隐私保护。

其次，对于用户来说，每个人都有不同的使用习惯和偏好，而智能语音助手则完全有能力在同一终端实现实现千人千面的个性化服务。通过声纹识别来作为身份识别方式，则可以非常自然的实现身份的切换。比如，在家庭当中，当你对智能音箱说，“帮我定个昨天中午一样的快餐”，同时你的哥哥也说“帮我也定一个昨天中午一样的快餐”，注意这里可能你们两个人昨天中午定的快餐是完全不一样的，如果有了声纹识别，就能够识别两个语义完全相同的语音指令是由哪两个人所发出的，然后根据这两个人的不同的习惯（昨天中午这两个人分别定的是什么快餐），来满足不同的需求。显然，这样的用户体验，是其他生物识别方式所难以实现的。比如人脸识别，确实可以实现同时对于多个用户的身份识别，但是你要定个快餐，却没法直接通过人脸来下达指令。

另外，声纹识别还具有一些其他生物识别技术所没有的优势。比如，声纹识别是非接触式的，可以通过语音传递进行声纹信息，从而不用接触到机器本身，就可以进行声音识别。这两个特点有使得声纹识别可以应用在很多领域，比如可以进行远程认证。

不过，声音跟虹膜、人脸都存在同样的受环境干扰的问题，比如人脸、虹膜会受到光学环境的干扰，而声纹则会受到环境噪声的干扰。当然在没有光的情况下是可以用声纹识别的，如果是不能开口的情况下，则只能用其他的识别技术。

可以说，如果未来语音将作为重要的人机交互方式，那么声纹识别则将是与之相匹配的最佳的身份认证方式。

虽然目前生活当中，声纹识别似乎接触的很少。但是，实际上，我们所熟悉的很多产品以及应用都已经开始加入了声纹识别功能。

比如去年推出多款智能音箱产品其实都有加入了声纹识别。苹果iPhone 7之后的语音助手Siri也加入了声纹识别功能。今年6月，腾讯推出Qrobot小Q机器人第二代也采用了声纹识别技术，而这款产品的声纹识别技术就是由SpeakIn所提供的。

当然，就目前来说，相比指纹识别、人脸识别、虹膜识别等生物识别技术来说，传统的单纯基于云端的声纹识别技术还存在着一些不足，但是通过推出专用的声纹识别硬件模组，在终端侧进行部署，通过边缘计算+云端人工智能的方式，将会极大提升声纹识别的准确率和实用性。期待SpeakIn能够给我们带来不一样的体验。

打开APP阅读更多精彩内容