中国电信发布首个支持30种方言混说语音大模型

CHANBAEK 2024-05-28 1399

中国电信人工智能研究院（TeleAI）近日发布了一项引领业界的语音识别技术——星辰超多方言语音识别大模型。这一模型突破性地支持30种方言的自由混说识别，打破了传统单一模型只能识别特定方言的局限。

星辰大模型能够同时识别和理解粤语、上海话、四川话、温州话等30多种方言，为用户提供更为便捷和准确的语音服务。为了支持这一创新技术，中国电信人工智能研究院已构建了一个包含超过30种方言、总时长超过30万小时的高质量数据库。

在技术研发过程中，研究院首创了“蒸馏+膨胀”联合训练算法，成功解决了超大规模多场景数据集和大规模参数条件下预训练坍缩的难题。这一算法保证了1B参数80层模型的稳定训练，进一步提升了模型的识别精度和鲁棒性。

星辰大模型的发布，不仅体现了中国电信在人工智能领域的强大实力，也为多方言环境下的语音识别技术提供了全新的解决方案。未来，这一技术有望广泛应用于智能客服、智能家居、语音翻译等领域，为人们的生活带来更多便利。

打开APP阅读更多精彩内容