循环神经网络可以看到,但它是串行的,一个字一个字往后递,速度慢得要命,而且同样存在梯度消失。
只不过是时间维度上的梯度消失。
那如果……
任少卿摇了摇头,把这个念头暂时压下去。
他现在面前摆着一堆更紧迫的问题。
论文要不要写?投哪个会议?实验还需要补哪些对照组?
一百层的网络还没跑,一百五十层呢?
目标检测任务上的迁移效果怎么样?
另外,残差连接这个结构目前只在图像分类上验证过。
要推广到其他任务、其他数据类型,工作量巨大。
The content is not finished, continue reading on the next page