适配器微调在推荐任务中的几个关键因素
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
再登Nature!DeepMind大模型突破60年数学难题,解法超出人类已有认知
NeurIPS23|视觉 「读脑术」:从大脑活动中重建你眼中的世界
ICLR 2024高分投稿:用于一般时间序列分析的现代纯卷积结构
GPT推断中的批处理(Batching)效应简析
DeepMind论文登上Nature:困扰数学家几十年的难题,大模型发现全新解
拆解大语言模型RLHF中的PPO算法
大规模神经网络优化:超参最佳实践与规模律
陶哲轩用 AI 形式化的证明究竟是什么?一文看懂 PFR 猜想的前世今生
星载传算能力——天地一体化网络在轨边缘计算产业发展的拦路虎
任意文本、视觉、音频混合生成,多模态有了强大的基础引擎CoDi-2
NeurIPS 2023 | 清华ETH提出首个二值化光谱重建算法
NeurIPS 2023 | AI Agents先行者CAMEL:首个基于大模型的多智能体框架
全新近似注意力机制HyperAttention:对长上下文友好、LLM推理提速50%
13B模型全方位碾压GPT-4?这背后有什么猫腻
把ChatGPT塞进副驾驶!清华、中科院、MIT联合提出Co-Pilot人机交互框架
NeurIPS 2023 | 北大具身智能团队提出需求驱动导航:对齐人类需求,让机器人更高效
从ID-based到LLM-based:可迁移推荐系统发展
Runway新功能「运动笔刷」再次惊艳AI圈:随手一涂,图片就动起来了