我的印象中,用采样后的做softmax,和你说的那个用sigmoid那个算正负样本都可以的。而且你说的这个效果会更好(论文中说的)。 https://arxiv.org/abs/1402.3722