RISC -V跑大模型(一)
语言模型的发展历程 基于神经网络的语言模型解析
人大发表迄今为止最大最全的大模型综述
CPU、GPU与算存互连的复杂比较与重要性分析
通往AGI之路:揭秘英伟达A100、A800、H800、V100在高性能计算与大模型训练中的霸主地位
如何设计一个高效的分布式日志服务平台
LLM in Medical Domain: 一文速览大语言模型在医学领域的应用
AI算力研究框架(2023)
2023北京智源大会亮点回顾 | 高性能计算、深度学习和大模型:打造通用人工智能AGI的金三角
科技云报道:大模型时代,AI基础软件机会何在?
核芯互联推出符合DB2000QL及PCIe Gen5和Gen 6标准的低抖动时钟缓冲器CLB2000
我在iPhone上装了70亿参数大模型,来自陈天奇团队最新成果
图解大模型训练之:Megatron源码解读2,模型并行
图解大模型系列之:Megatron源码解读1,分布式环境初始化
基于Transformer做大模型预训练基本的并行范式
AI大模型如何推动服务器产业链需求
GTC 2023:短视频多模态超大模型的场景应用
一个给NLP领域带来革新的预训练语言大模型Bert
大模型为什么是深度学习的未来?
有了Fine-tune-CoT方法,小模型也能做推理,完美逆袭大模型