RoPE可能是LLM时代的Resnet
MATLAB残差神经网络设计
MLPerf世界纪录技术分享:优化卷积合并算法提升Resnet50推理性能
深度学习与图神经网络学习分享:CNN经典网络之-ResNet
ResNet本质上就干了一件事:降低数据中信息的冗余度。
Batch的大小、灾难性遗忘将如何影响学习速率