ICLR 2024 清华/新国大/澳门大学提出一模通吃的多粒度图文组合检索MUG:通过不确定性建模,两行代码完成部署
Food2K:大规模食品图像识别
六自由度视觉定位
以人为本的机器学习工具是AI在医学领域打开的正确方式。
深度学习时代,能否实现照片“隐写术”?