深度学习 – 人们为图像网络实验选择224×224图像大小有什么特别的原因吗?

难道224×224由于某种原因或仅仅是计算约束而提供更好的准确性吗?我认为更大的图片应该提供更好的准确性,不是吗? 最佳答案 更大的图像包含更多可能相关或不相关的信息.输入的大小很重要,因为输入越大,网络必须处理的参数越多.更多参数可能会导致一些问题,首先您需要更多的计算能力.然后你可能需要更多的数据来训练,因为很多参数和没有足够的样本可能导致不合适,特别是CNN.

AlexNet对224的选择也允许他们应用一些数据扩充.

例如,如果你有一个512×512的图像并且想要识别一个对象,最好将其重新采样为256×256并获得224×224或200×200的较小补丁,进行一些数据扩充然后进行训练.如果您有足够的数据,您还可以使用400×400的补丁并进行数据增强和训练.

不要忘记进行交叉验证,以便检查是否过度拟合.

点赞