人工智能
李未可科技多模态AI大模型正式发布,积极推进AI在终端的场景应用
4月18日,2024中国生成式AI大会上李未可科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。
该大模型围绕 GPS 轨迹+视觉+语音打造新一代 LLM-Based的自然交互,同时多模态问答技术的加持,能实现所见即所问、所问即所得的精准服务。此外,融合了人类意图理解、长期记忆机制、情感大模型及TTS 克隆,可以为用户提供超拟人的情感陪伴服务。
为保证实时交互场景的智能性及响应速度 ,WAKE-AI 使用 MOE 架构,FlashAttention 混合精度训练、知识蒸馏等技术大幅降低算力需求跟计算时间。该大模型针对眼镜端用户的使用方式、场景等进行了优化。在语音返回速度上能做到<500ms以内,语音唤醒的准确度>90%,ASR字错率低于2%。同时为用户提供在室外多个场景,如户外运动、文化旅行、日程管理及实时翻译的多模态AI服务。
据悉,李未可将于近期正式发布搭载WAKE-AI能力的新终端,从室外场景切入为用户提供更智能、更全面的AI+服务。
会上,李未可科技合伙人&AI负责人古鉴表示WAKE-AI 将逐步开放平台能力,便于更多企业及开发者调用WAKE-AI能力,共建AI+硬件生态。
全部0条评论
快来发表一下你的评论吧 !