他几乎是本能地想到了那个词。
宽度。
或者更准确地说,视野。
卷积网络的每一层只能看到一个局部窗口。
三乘三,五乘五,最大也就七乘七。哪怕你把网络堆到一百层,每一层看到的依然是一小块局部区域。
它通过层层叠加来扩大感受野,但这种扩大是间接的,是逐层递推的,不是一步到位的。
如果数据不是图片呢?
如果是一段文字,一个句子,一篇文章?
文字里的语义关联可以跨越整个句子。
第一个字和最后一个字之间可能存在关键的依赖关系。卷积核看不到那么远。
The content is not finished, continue reading on the next page