一种完全由LLM + 启发式搜索算法结合的TOT算法
基于Transformer的大型语言模型(LLM)的内部机制
ChatGLM-6B的局限和不足
基准数据集(CORR2CAUSE)如何测试大语言模型(LLM)的纯因果推理能力
GPT-4已经会自己设计芯片了吗?
基于多任务预训练模块化提示
Macaw-LLM:具有图像、音频、视频和文本集成的多模态语言建模
LLM in Medical Domain: 一文速览大语言模型在医学领域的应用
中文信息处理实验室提出工具学习新框架ToolAlpaca
基于预训练模型和语言增强的零样本视觉学习
LeCun世界模型首个研究!自监督视觉像人一样学习和推理!
大语言模型中的常用评估指标
GPT总设计师:大型语言模型的未来
多模态上下文指令调优数据集MIMIC-IT
Allen AI推出集成主流大语言模型的LLM-BLENDER框架
号称「碾压」LLaMA的Falcon实测得分仅49.08,HuggingFace决定重写排行榜代码
PyTorch教程-9.3. 语言模型
一个通用的自适应prompt方法,突破了零样本学习的瓶颈
GPT4技术原理之相变与涌现
调教LLaMA类模型没那么难,LoRA将模型微调缩减到几小时