开发者可以直接在浏览器中试用全新的 NVIDIA AI Foundation Models,使用 NVIDIA AI Foundation Endpoints 在应用程序中进行测试,然后使用专有的业务数据进行自定义。
如今,免费、开源的大语言模型对企业来说就像是一顿“自助餐”。但对于构建自定义生成式 AI 应用的开发者来说,这顿“大餐”可能会让他们应接不暇,因为他们需要满足各种不同的项目和业务需求,比如兼容性、安全性和用来训练模型的数据。 NVIDIA AI Foundation Models 集企业级预训练模型之大成,为开发人员提供了针对企业应用定制生成式 AI 的良好开端。
NVIDIA 优化的基础模型加速创新
NVIDIA AI Foundation Models 可通过简单的用户界面或 API 直接在浏览器体验。此外,这些模型还可通过 NVIDIA AI Foundation Endpoints 进行访问,以便在企业应用中测试模型性能。
Llama 2、Stable Diffusion XL 和 Mistral 等现有的领先社区模型在格式化后,可帮助开发者利用其专有数据精简自定义过程。此外,这些模型还通过 NVIDIA TensorRT-LLM 进行了优化,以提供最高的吞吐量和最低的时延,同时支持在任一 NVIDIA GPU 加速堆栈上的大规模运行。例如,经过 TensorRT-LLM 优化的 Llama 2 模型在 NVIDIA H100 上的运行速度提高了近 2 倍。 新的 NVIDIA Nemotron-3 8B 基础模型系列可支持创建当今领先的企业聊天与问答应用,并适用于医疗、电信和金融服务等众多行业。 这一系列模型是客户构建安全且生产就绪的生成式 AI 应用的起点。这些模型在可靠的数据集上训练而成,其性能可媲美规模更大的模型,因此成为企业部署的理想之选。 多语言功能是 Nemotron-3 8B 系列模型的关键优势之一。这些开箱即用的模型精通 50 多种语言,包括英语、德语、俄语、西班牙语、法语、日语、中文、韩语、意大利语和荷兰语。
加快从自定义到部署的全过程
在跨业务功能中使用生成式 AI 的企业需要一个 AI foundry,以便为其独特的应用自定义模型。NVIDIA 的 AI foundry 具备三个要素:NVIDIA AI Foundation Models、NVIDIA NeMo 框架和工具,以及 NVIDIA DGX 云 AI 超级计算服务。它们共同提供了端到端的企业级服务,以创建自定义生成式 AI 模型。
重要的是,企业拥有其定制化模型,也就可以通过 NVIDIA AI Enterprise 软件将其部署到几乎任何地点,并获得企业级的安全性、稳定性和支持。 NVIDIA AI Foundation Models 现已在 NVIDIA NGC 目录(https://catalog.ngc.nvidia.com/ai-foundation-models.ngc.nvidia.com/ai-foundation-models)和 Hugging Face 上免费提供,并且也托管于 Microsoft Azure AI 模型目录中。
GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。扫描下方海报二维码,立即注册 GTC 大会。
原文标题:NVIDIA 加快企业自定义生成式 AI 模型开发
文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
全部0条评论
快来发表一下你的评论吧 !