机器学习 – 卷积神经网络中的旋转等价?

我想知道CNN的基本架构是否具有旋转等效性?我只知道平移等效但不确定旋转.

从我的搜索中,可以通过旋转输入图像进行训练来实现旋转等效.我真的需要这样做吗?旋转度有多大?为了放置更多的上下文,例如,我有一个可以在横向模式下检测/读取文本的CNN.如果我将图像旋转90度/使其成像,它会得到与原始图像相同的结果/执行相同的结果吗?

最佳答案 您只在某种程度上具有比例和旋转不变性 – 具体取决于您的设置.您拥有它,因为包含这些功能的池可能会重叠.

你提出的建议当然是可能的.您可以随时修改训练数据,添加噪音,旋转,不同比例等,以实现该目标.但是,您的模型仍然不会完全旋转不变.也可以修改网络本身以“正确”完成任务.我确信你在研究期间偶然发现了Tiled CNNs(如果没有,你一定要读那篇论文).他们使用TICA进行预训练,在此过程中找到不变的特征.

对于旋转90°的最后一个问题:我建议你自己测试一下.如果发生旋转的情况是已知的(例如在移动设备上),我个人会看到手动将图片旋转回0°(在将其提供给网络之前)是否是给定约束的令人满意的解决方案.这是最简单的方法.

点赞