基于星火大模型的智能编程助手iFlyCode简介
大模型未来的产业发展趋势和挑战是什么
开源大模型FLM-101B:训练成本最低的超100B参数大模型
LLaMA微调显存需求减半,清华提出4比特优化器
揭秘英伟达A100、A800、H100、H800 GPU如何实现高性能大模型的百倍训练加速
大模型外挂知识库优化-大模型辅助向量召回
大模型的优劣势有哪些
大模型心高气傲,没有AI Agents生死难料
大模型的位置编码和外推性问题一样吗
十分钟读懂旋转编码(RoPE)
基于Tansformer架构的ChatGPT原理解析
AI大模型终于走到了数据争夺战
跑大模型AI的K8s与普通K8s的区别分析
开放加速规范AI服务器的设计方法
中科大&字节提出UniDoc:统一的面向文字场景的多模态大模型
OpenAI开放大模型微调功能!
大模型分布式训练并行技术(一)-概述
BaiChuan13B多轮对话微调范例
解析优化的调度逻辑和cuda实现
风口浪尖行稳致远 - 英伟达等企业如何顺应高性能计算大模型浪潮