顶级AI科学家呼吁全球加强AI风险应对措施
特斯拉自动驾驶团队再受重挫,顶尖工程师Paril Jain离任,高层人事变动
微软发布phi-3AI模型,性能超越GPT-3.5
英伟达首席执行官黄仁勋解析公司战略及人工智能未来
瑞士苏黎世联邦理工学院新型四足机器人单腿完成开关门、移动任务
图解大模型RLHF系列之:人人都能看懂的PPO原理与源码解读
RL究竟是如何与LLM做结合的?
人工智能是什么的一个分支
武大+上交提出BatGPT:创新性采用双向自回归架构,可预测前后token
碾压GPT-4!谷歌DeepMind CEO自曝:下一代大模型将与AlphaGo合体
7个流行的强化学习算法及代码实现
谷歌DeepMind发现更快排序算法,已集成到C++库
基于4000万公里量产车驾驶数据训练,参数规模1200亿
强化学习与智能驾驶决策规划
MoDem解决了视觉强化学习领域的三个挑战
强化学习正在推进AI应用
张俊林:ChatGPT会成为下一代搜索引擎吗
ChatGPT能否取代Google、百度等传统搜索引擎
一种利用任何形式的先验策略来改进初始化强化学习任务的探索的方法
人工智能学习 迁移学习实战进阶