SmartCow的Apollo音频/视频AI工程套件

描述

  市场研究估计,自然语言处理市场将从 2021 年的 209.8 亿美元增长到 2028 年的超过 1270 亿美元。同样,人工智能视觉市场预计将从 2020 年的 70.4 亿美元增长到 1444.6 亿美元。

  显然,人工感官知觉正在兴起。

  对于构建视觉和对话计算系统的开发人员,Smart Cow Apollo AI 工程套件考虑了 NVIDIA Jetson Xavier NX 计算模块的 21 TOPS 性能和四个麦克风、两个扬声器端子、两个 3.5 毫米电话插孔、一个 8MP 摄像头模块、一个 OLED 显示器,以及一个 128 GB NVMe SSD 进入等式。

  Apollo 套件的特色NVIDIA Jetson Xavier NX 计算模块与 NVIDIA Riva、DeepStream 和开箱即用的 JetPack SDK 可加速创建基于边缘 AI 的自动语音识别 (ASR) 和自然语言处理 (NLP) 解决方案。

  两个 PVA 视觉加速器、两个深度学习加速器、H.264 和 H.265 视频编码器/解码器增强了这种性能。高速数据传输还可以使用 8 GB 到 16 GB 的 128 位 LPDDR4x 内存,运行速度高达 60 Gbps,或者通过使用 16 GB 的板载 eMMC 5.1 闪存使事情更持久。

  当然,Apollo Kit 的独特之处在于它周围的一切:

  内置音频编解码器支持其 4 个 MEMS 麦克风

  8MP IMX179 摄像头模块支持多种视觉应用

  2.08 英寸 OLED 显示屏显示状态和其他读数

  随附的 128 GB NVMe SSD 预装了上述 NVIDIA SDK

  底架使其能够直立以进行符合人体工程学的工程

  SmartCow Apollo 音频/视频工程套件在行动:

  希望开发基于感知的应用程序原型的开发人员可以通过设备正面的 40 针接头或侧面的 USB 端口访问 Apollo Kit 资源。套件上还有一个以太网 RJ45 插孔,供希望在项目中添加网络元素的用户使用。

  通过系统访问,工程师几乎可以立即开始利用 NVIDIA SDK 提供的所有软件功能。不仅 Riva、DeepStream 和 JetPack SDK 提供了简化应用程序开发的框架,在许多情况下,SmartCow 还在套件上实施了可立即运行的演示和用例优化的 AI 模型,以帮助您起步。

  例如:

  ASR示例利用 NVIDIA Citrinet 模型转录口语(语音到文本)

  基于开源 NLTK 模型的 NLP 示例应用程序分析文本数据以确定输入文本的正面或负面程度,该应用程序将在 OLED 屏幕上显示一头表情牛。此设置还支持命名实体识别 (NER),这是一个从句子中确定命名实体的过程。

  第三个聊天机器人演示利用 Chatterbot 开源 GitHub 存储库在 Jetson 上创建两个互相通信的聊天机器人实例。用户可以运行其他 NLP 任务,例如对聊天机器人生成的文本进行情感分析,并在生成的文本上使用文本到语音。

  该套件随附的其他软件包括用于视听 AI 应用程序的 Gstreamer (webRTC) 开源多媒体框架示例和主机 Ubuntu Linux 操作系统。

  Apollo 音频/视频 AI 工程套件入门

  Apollo 音频/视频 AI 工程套件的尺寸为 81 x 69 x 125 毫米,因此您真正需要的只是工作台和开发 PC 上的足够空间。

  审核编辑:郭婷

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分