为什么在后面加2层FC,为什么不加1层或3层。这个问的有点过分了,虽然价值为零但是很有启发意义,怎么不问Alexnet为什么要搭5层卷积而不是7层、8层,11层。他怎么不问为什么VGG的FC Layer是4096个神经元而不是1000个或者128,为什么?为什么要用卷积不用小波核?为什么要用bp而不用离散优化法等等。他问的这个问题触及到了神经网络、卷积网络、RNN的网络的软肋——可解释性。