Allen AI推出集成主流大语言模型的LLM-BLENDER框架
号称「碾压」LLaMA的Falcon实测得分仅49.08,HuggingFace决定重写排行榜代码
PyTorch教程-9.3. 语言模型
一个通用的自适应prompt方法,突破了零样本学习的瓶颈
GPT4技术原理之相变与涌现
调教LLaMA类模型没那么难,LoRA将模型微调缩减到几小时
时下改变AI的6大NLP语言模型
以Gpipe作为流水线并行的范例进行介绍
大型语言模型能否捕捉到它们所处理和生成的文本中的语义信息
Meta AI重磅推出LIMA!媲美GPT-4、无需RLHF就能对齐!
GPT-4推理提升1750%!清华姚班校友提出全新ToT框架
GPT-4 的模型结构和训练方法
邱锡鹏团队提出具有内生跨模态能力的SpeechGPT,为多模态LLM指明方向
邱锡鹏团队提出SpeechGPT:具有内生跨模态能力的大语言模型
如何利用LLM做一些多模态任务
使用Alpaca-Lora进行参数高效模型微调
大语言模型的多语言机器翻译能力分析
OpenAI用GPT-4解释了GPT-2三十万个神经元:智慧原来是这个样子
蒸馏也能Step-by-Step:新方法让小模型也能媲美2000倍体量大模型
涌现能力的定义、常见的激发手段和具体的分类和任务