Transformer在下一个token预测任务上的SGD训练动态
zircon微内核启动代码分析
浅析AI大型语言模型研究的发展历程
性能媲美同时成本降低98%,斯坦福提出FrugalGPT,研究却惹争议
腾讯云存储针对AIGC大模型业务的应对之道
ChatGPT 时代,程序员的生存之道 | 人工智能 AI
ChatGPT横空出世 人工智能进入大模型时代
探索ChatGPT的信息抽取能力
LLM在各种情感分析任务中的表现如何
ETH提出RecurrentGPT实现交互式超长文本生成
ChatGPT背后的大模型技术
调教LLaMA类模型没那么难,LoRA将模型微调缩减到几小时
支持 ChatGPT 的机器学习模型的概况
Meta AI重磅推出LIMA!媲美GPT-4、无需RLHF就能对齐!
Linux命令执行Bypass常见姿势介绍
LangChain简介
浅析推理加速引擎FasterTransformer
微软自研人工智能芯片进程脉络梳理
无人机应用中ChatGPT的交互设计方案
大语言模型的多语言机器翻译能力分析