智谱推出深度推理模型GLM-Zero预览版
蚂蚁集团收购边塞科技,吴翼出任强化学习实验室首席科学家
谷歌AlphaChip强化学习工具发布,联发科天玑芯片率先采用
NVIDIA Isaac Lab助力银河通用打造灵巧手抓取技能模型
顶级AI科学家呼吁全球加强AI风险应对措施
特斯拉自动驾驶团队再受重挫,顶尖工程师Paril Jain离任,高层人事变动
微软发布phi-3AI模型,性能超越GPT-3.5
英伟达首席执行官黄仁勋解析公司战略及人工智能未来
瑞士苏黎世联邦理工学院新型四足机器人单腿完成开关门、移动任务
图解大模型RLHF系列之:人人都能看懂的PPO原理与源码解读
RL究竟是如何与LLM做结合的?
人工智能是什么的一个分支
武大+上交提出BatGPT:创新性采用双向自回归架构,可预测前后token
碾压GPT-4!谷歌DeepMind CEO自曝:下一代大模型将与AlphaGo合体
7个流行的强化学习算法及代码实现
谷歌DeepMind发现更快排序算法,已集成到C++库
基于4000万公里量产车驾驶数据训练,参数规模1200亿
强化学习与智能驾驶决策规划
MoDem解决了视觉强化学习领域的三个挑战
强化学习正在推进AI应用