《大教堂与集市》一书中提到,“开源不只是为了让我们能够看到代码,它更是为了让我们能够使用代码 ——而后者,才是开源真正的魔力,或者说,力量所在。”
开源的出现,为推动全球科技进步起到了巨大的推动作用。因其允许全球的开发者共同参与、贡献和分享代码,具有成熟的框架和工具,可以大大降低开发成本,促进技术的创新和落地应用。
伴随着AI技术的飞速发展,越来越多的开发者投身到AI领域的探索。斯坦福人工智能研究所(HAI)发布的《2023年人工智能指数报告》中提到,自2011年以来,与AI相关的GitHub项目总数稳步增长,从2011年的1536个增加到2022年的347934个。
作为国内人工智能行业的龙头企业,科大讯飞在语音识别、自然语言理解、图像识别等领域有着深厚的技术积累,致力于持续推动人工智能产业生态的繁荣。其中,讯飞开放平台目前已开放560 项 AI 能力及场景方案,聚集450万开发者团队。
近期,讯飞开放平台上线开源开放的多维度、多功能AI模型开放平台——ModelMatrix,已接入40+个模型,面向自然语言理解、图像、语音等多领域,提供前沿模型的在线体验服务,点击上传模型的输入参数即可体验模型效果,适用于多种应用场景。即使是零代码基础的AI爱好者,也可轻松上手。
降低使用门槛,推进AI产业应用
AI模型是AI产业的重要基础设施,因其具有自监督学习能力,更强的通用性及智能程度,使AI能广泛赋能各行业应用。
2017年Google研究团队在发表的论文《Attention Is All You Need》中首次提到Transformer模型,并将此进行开源,目前包括ChatGPT等在内的大模型基本都是Transformer演变而来。多个重要领域比如生物医疗、智能制造等,也有基于Transformer模型落地的技术产生。
但传统AI模型的开发和应用需要大量的计算资源和存储资源,同时模型训练、安装配置等过程复杂,无形中提高了使用门槛,让非AI开发者难以参与AI的开发。
只有进一步推动AI开放,激励开发者把AI模型集成到实际开发应用中,让更多非AI开发者感受、体验到AI的乐趣,才能实现AI普惠,加速AI在更多场景的落地。
40+精选模型,轻松体验
ModelMatrix上线的40多个模型中,除有讯飞自研的语音合成、OCR识别等模型外,还精选了一批来自第三方的模型,具有易上手、兼具趣味性和专业性的特点。
使用体验方面,以前想让AI模型跑起来,从代码下载到安装部署再到效果验证,往往需要数天。在ModelMatrix平台上,每个模型的在线体验页面,只需几次点击,就能0代码体验各种模型效果,无论是完全不懂AI的小白还是开发者都能获得极佳的体验。
模型种类方面,ModelMatrix已上线的模型包括图片生成图片、图片生成视频、OCR、目标检测、图像分割、文本生成图片、文本生成语音、表格问题回答、文档分析、文本总结、文本分类、可视化问题回答等。
AI绘画:生成数字艺术作品、辅助人类绘画和创建特效场景。只需输入描述文本,即可生成对应风格的图片作品
语音合成:根据您输入的文本,我们可以为您合成对应的语音音频。支持单人配音、多人配音或剧本配音;支持选择中文、英文、方言等不同语种;支持选择女声、男声、童声等不同声龄;支持调节不同发音情感类型,以及语速、语调、音量等系数
AI人物动画照和视频生成:上传相片即可转化动漫照,还能生成视频
种草文案智能创作体验:根据选择的商品品牌、品类、成分、功效、适用人群等信息,快速创作出种草文案
A.I.音乐家:基于词曲的语音合成新里程,采用讯飞语音合成技术,将乐谱和歌词转化成歌唱技术。基于端到端的歌唱合成系统,结合讯飞算法大幅提升歌唱合成的变现力
审核编辑 :李倩
全部0条评论
快来发表一下你的评论吧 !