NVIDIA 加快企业自定义生成式 AI 模型开发

描述

开发者可以直接在浏览器中试用全新的 NVIDIA AI Foundation Models,使用 NVIDIA AI Foundation Endpoints 在应用程序中进行测试,然后使用专有的业务数据进行自定义。

 

英伟达

 

如今,免费、开源的大语言模型对企业来说就像是一顿“自助餐”。但对于构建自定义生成式 AI 应用的开发者来说,这顿“大餐”可能会让他们应接不暇,因为他们需要满足各种不同的项目和业务需求,比如兼容性、安全性和用来训练模型的数据。  NVIDIA AI Foundation Models 集企业级预训练模型之大成,为开发人员提供了针对企业应用定制生成式 AI 的良好开端。

 

NVIDIA 优化的基础模型加速创新

 

NVIDIA AI Foundation Models 可通过简单的用户界面或 API 直接在浏览器体验。此外,这些模型还可通过 NVIDIA AI Foundation Endpoints 进行访问,以便在企业应用中测试模型性能。

 Llama 2、Stable Diffusion XL 和 Mistral 等现有的领先社区模型在格式化后,可帮助开发者利用其专有数据精简自定义过程。此外,这些模型还通过 NVIDIA TensorRT-LLM 进行了优化,以提供最高的吞吐量和最低的时延,同时支持在任一 NVIDIA GPU 加速堆栈上的大规模运行。例如,经过 TensorRT-LLM 优化的 Llama 2 模型在 NVIDIA H100 上的运行速度提高了近 2 倍。  新的 NVIDIA Nemotron-3 8B 基础模型系列可支持创建当今领先的企业聊天与问答应用,并适用于医疗、电信和金融服务等众多行业。  这一系列模型是客户构建安全且生产就绪的生成式 AI 应用的起点。这些模型在可靠的数据集上训练而成,其性能可媲美规模更大的模型,因此成为企业部署的理想之选。  多语言功能是 Nemotron-3 8B 系列模型的关键优势之一。这些开箱即用的模型精通 50 多种语言,包括英语、德语、俄语、西班牙语、法语、日语、中文、韩语、意大利语和荷兰语。

 

加快从自定义到部署的全过程

 

在跨业务功能中使用生成式 AI 的企业需要一个 AI foundry,以便为其独特的应用自定义模型。NVIDIA 的 AI foundry 具备三个要素:NVIDIA AI Foundation Models、NVIDIA NeMo 框架和工具,以及 NVIDIA DGX  AI 超级计算服务。它们共同提供了端到端的企业级服务,以创建自定义生成式 AI 模型。

 

 重要的是,企业拥有其定制化模型,也就可以通过 NVIDIA AI Enterprise 软件将其部署到几乎任何地点,并获得企业级的安全性、稳定性和支持。  NVIDIA AI Foundation Models 现已在 NVIDIA NGC 目录https://catalog.ngc.nvidia.com/ai-foundation-models.ngc.nvidia.com/ai-foundation-models和 Hugging Face 上免费提供,并且也托管于 Microsoft Azure AI 模型目录中。        

GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。扫描下方海报二维码,立即注册 GTC 大会

 

 


原文标题:NVIDIA 加快企业自定义生成式 AI 模型开发

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。


打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分