如果bert中去掉self-attention层,还可以拿到词嵌入么,为什么? 楼主这个问题怎么回答的?