collamark
这种方法大幅提高了Adam方法的泛化能力,且在图像分类数据集上与带动量SGD方法效果相当
source
Terms
Privacy Policy
Contact